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Avant-Propos 


Ce livre s'adresse à des étudiants scientifiques d’un cursus Licence uti- 
lisant les Mathématiques comme outil de calcul, que ce soit dans le 
cadre de sciences générales pour l'ingénieur ou dans des disciplines 
spécifiques. C’est pourquoi l’on y présente de nombreux exemples d’ap- 
plications dans des domaines variés, comme la Physique, les Sciences 
de la Vie, l'Économie ou la théorie du contrôle. 


Les étudiants en Mathématiques, en Mathématiques appliquées ou en 
Informatique pourront aussi y découvrir des techniques de calcul, des 
exemples de modélisation et des problématiques que leur programme 
théorique ne laisse pas le temps d'explorer suffisamment. 


Le livre se partage à peu près équitablement entre l'algèbre et l'analyse. 
S'agissant des méthodes numériques et des algorithmes présentés, le 
choix, nécessairement très sévère, s’est porté sur les plus courants et tient 
compte de l'efficacité, de la généralité et de la simplicité de mise en œuvre. 


Dans le cours, les notions acquises dans une classe de Terminale scien- 
tifique sont supposées connues. Afin de développer des applications 
suffisamment riches tout en restant à un niveau élémentaire, de nom- 
breux résultats ont été admis, parfois avec un commentaire explicatif 
ou heuristique appelé justification. Le terme démonstration est réservé à 
une argumentation complète sur le plan mathématique. 


Les exercices sont des applications utiles et directes du cours. Il sont 
très généralement calculatoires, de sorte qu’on doit les faire à l’aide 
d'une calculatrice ou d’un logiciel de calcul scientifique. Quelques rares 
exercices apportent un petit complément théorique qu'il faut considé- 
rer comme un résultat à connaître. Le signe @ indique que l’on trouvera 
une solution ou des indications dans les « Compléments en ligne » à 
l'adresse http://www.dunod.com. 


Je remercie mes collègues de différentes disciplines qui ont bien voulu 
m'éclairer en répondant à mes questions et notamment Jacqueline con- 
cernant la problématique des Statistiques et des Probabilités. Merci à 
Eric pour son soutien technique et ses idées originales et à Michèle pour 
la marmotte. 

Merci à Christian qui a relu le texte avec acuité : ses remarques perti- 
nentes sont à l’origine de nombreuses améliorations. Un grand merci à 
Alberto qui, avec talent et gentillesse, a assuré un gros travail de mise 
en page et la réalisation finale de toutes les figures. 


Et surtout, merci à Dominique. 
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Chapitre 1 


Ensembles, 
nombres et fonctions 


1. Langage et notations pour utiliser les ensembles 


En Mathématiques, on définit souvent des collections d'objets appelées ensembles. Voici 
les notions générales et les expressions couramment employées lorsqu'on considère 
des ensembles. 


1.1 Éléments et parties d'un ensemble 


Éléments d'un ensemble. En général, on désigne un ensemble par une lettre. Si par 
exemple Æ désigne un ensemble, alors chaque objet a de la collection Æ s'appelle 
un élément de E : on dit que a appartient à E et l’on exprime cette propriété en 
écrivant a € E. Le signe € est le symbole d'appartenance. Des ensembles sont 
égaux s'ils ont les mêmes éléments. 

Parties d'un ensemble. Supposons que E est un ensemble. On appelle partie de E 
un ensemble formé de certains éléments de Æ. Une partie de Æ est donc un en- 
semble À ayant la propriété suivante : tout élément de À est aussi un élément de E. 
Pour exprimer que l’ensemble À est une partie de l’ensemble E, on dit aussi que À 
est inclus dans E, ce que l’on note AC E. Le signe d’inclusion € ne s'écrit qu'entre 
deux ensembles et ne doit pas être confondu avec le signe d'appartenance €. 
Pour montrer que des ensembles E et F sont égaux, il faut vérifier que l’on a les 
deux inclusions ECFet FCE. 

Propriété caractéristique d'une partie. Supposons que l’on ait défini pour chaque 
élément x de E une propriété (x) qui peut être satisfaite ou non. L'ensemble 
des éléments x € E qui satisfont la propriété #(x) est une partie de E que l’on 
note {xE E|#P(x)}, ce qui se lit “l’ensemble des éléments x appartenant à E tels 
que P(x)”. Si l'on pose A—{xE E|#(x)}, la propriété F s'appelle la propriété 
caractéristique de À. 
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Exemple 1. Notons E l’ensemble des nombres entiers compris entre —5/2 et 
11/3. Les nombres 2 et 3 appartiennent à l’ensemble E, alors que —3 n’y appartient 
pas : on a donc les relations 2 € E et —3 & E. Les éléments de l’ensemble £ sont 
exactement les nombres —2, —1, 0, 1, 2 et 3 : pour exprimer cela, on écrit la liste 
des éléments entre accolades, sous la forme E — {—2,—1,0,1,2,3}. 


Exemple 2. Un nombre entier positif ou nul s'appelle un entier naturel et l'ensemble 
de tous les entiers naturels se note N. Par exemple, 168/6 € N, 168/9 n'est pas un 
entier naturel et pour tout entier n>1, le nombre (1+45)"+(1-— 5)" appartient à N. 


Exemple 3. Un nombre entier positif ou négatif ou nul, s'appelle un entier rela- 
tif et l’ensemble des entiers relatifs se note Z. On a donc N={xeZ|x2>0} et 
{x eZ |0 < x? < 16} = {—3,-2,—1,1,2,3}. L'ensemble E de l'exemple 1 est une 
partie de Zetl'ona E={xeZ|0<x+2<5}. 


Définition 

Soient Æ et F° des ensembles. La donnée d’un élément x appartenant à E et d'un 
élément y appartenant à F s'appelle un couple et se note (x,y) ; la règle d'égalité 
est : (x,y) — (x',y) si et seulement si x = x et y = y. L'ensemble de ces couples 
se note E X F et s'appelle le produit cartésien des ensembles E et F. 


Exemples 4. On utilise souvent des couples de nombres. 


Les couples (1,2) et (2,1) sont deux éléments différents appartenant à l’ensemble 
NxN. 


— L'ensemble des nombres réels se note R. Les couples (x,y) de nombres réels sont 
les éléments de l’ensemble R x R = R?. Dans un plan muni d’axes, tout point est 
repéré par le couple (x,y) de ses coordonnées. 

On définit de même les triplets (x,y,2) de nombres réels : leur ensemble se note 
R*. Si l’on se donne un repère de l’espace, chaque point possède trois coordonnées : 
les triplets de nombres réels permettent de repérer les points de l’espace. 


— Voici des ensembles de couples de nombres réels : la figure de gauche représente 
le graphe d’une fonction f, celle de droite l’intérieur d’une ellipse (voir page 22). 


8Y 
8Y 


{@&y) ER |y=f(x)} {ay ER |lrl<3,ly <1} {(æ,y) ER° | 2° +4y° < 4} 
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1.2 Opérations sur les parties d'un ensemble 


Intersection de parties. Soient À et B des parties d’un ensemble E. Les éléments 
de Æ qui appartiennent à la fois à À et à B forment une partie de E appelée 
intersection de À et B et notée AN B. On a donc ANB={xEeE|rxeAetxeB} 
et aussi les relations d’inclusion AN BC A et ANBC B. 

Si aucun élément de E n'appartient à l'intersection de À et B, on dit que la partie 
ANB est vide et l’on écrit AN B = G. Le symbole & désigne l’ensemble qui n’a 


aucun élément. 

Réunion de parties. À et B étant des parties de ÆE, l’ensemble des éléments de E 
qui appartiennent à À ou à B est une partie de E appelée réunion de À et B et 
notée AU B. On a les inclusions A C AU B et BC AUB. 

Complémentaire d'une partie. Si À est une partie de E, l’ensemble des éléments 


de E qui n’appartiennent pas à À s'appelle le complémentaire de A et se note 
E \ À. On a les relations AU(E\ A)=E et AN(E\ À) = @. 


Exemple 5. Donnons-nous deux points distincts P et Q dans 
l’espace euclidien et considérons l’ensemble H des points 


de l’espace qui sont équidistants de P et Q : c'est le 
plan passant par le milieu Z du segment PQ et 
perpendiculaire à la droite (PQ). Le plan 

H s'appelle le plan médiateur de PQ. Soit 

R un autre point de l’espace différent de P 
et de Q et soit H' le plan médiateur de QR. Si 
les points P,Q,R ne sont pas alignés, l'intersection 
des plans Æ et H' est une droite D perpendiculaire 
au plan (PQR). Cette droite coupe le plan (PQR) en un point équidistant de P, Q 
et À, c'est-à-dire au centre du cercle circonscrit au triangle PQR. Si les points P,Q,R 
sont alignés, les plans Æ et H” sont parallèles et H N H' est l’ensemble vide. 


Exemple 6. Dans un plan euclidien, donnons-nous deux 
droites sécantes D et D'. L'ensemble des points du plan 
équidistants de D et D’ est la réunion des deux bissectrices 
de l'angle formé par D et D. 


Les nombres 


On exprime souvent un nombre par son écriture décimale. Pour un nombre entier 
ou décimal, il n’y a qu'un nombre fini de chiffres, alors qu’un nombre réel possède 
en général une écriture décimale illimitée. 
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2.1 Écriture d'un entier naturel 


Les chiffres d’un entier naturel représentent les unités dans l'échelle 1,10,10?,... 
des puissances positives de 10 : par exemple, pour l’entier a — 234, on a a — 
4+3 x 10+2 x 102. 

Voici comment retrouver les chiffres d’un entier par des opérations arithmétiques. 

- Puisque a =4+23 x 10, le chiffre des unités est le reste de la division de a par 10. 
- L'entier a — 4 étant multiple de 10, posons a — 4 — 1041, donc a1 = (a — 4)/10 — 
23 — 3 +2 x 10; le chiffre des dizaines est le reste de la division de a; par 10. 

- L'entier a —3 est multiple de 10 et en posant ai —3—100, il vient a2=(a1—3)/10—2 

qui est le chiffre des centaines. 
Pour écrire un algorithme de calcul des chiffres d’un entier a > 0, introduisons une 
variable x qui prendra successivement les valeurs a, a1,a2,... et une variable c dont 
les valeurs seront les chiffres de a; la liste L des chiffres sera composée en écrivant 
de droite à gauche. 


Algorithme de calcul des chiffres 
initialisation : (L + liste vide) (a + un entier positif) (x+ a) (b+ 10) 
boucle : tant que x # 0 : 

c+ reste de la division de x par b 

x + quotient de x — c par b 

L+c,L (on ajoute le chiffre c en tête de la liste L) 


Si au lieu de 10, on choisit pour b un entier naturel quelconque supérieur ou égal 
à 2, cet algorithme calcule les chiffres de l'écriture de l'entier a en base b, c'est-à-dire 
les entiers Co, C1,...,Cn tels que 


DSe<b et = gta x bte kb desde xD. 
La base 2 est commode, car il n’y figure que les chiffres 0 et 1. On a par exemple 
13=1+2+2% et 34=2+9 
donc, en base 2, ces nombres s’écrivent : 13 = [1101] et 34 = [100010]. 


2.2 Les entiers relatifs 


Un entier relatif est un entier positif ou négatif ou nul. Dans l’ensemble Z des entiers 
relatifs, on peut donc ajouter, soustraire et multiplier. 


Division euclidienne. Une autre opération essentielle qu’on peut effectuer avec 
des entiers relatifs, c’est la division avec reste, encore appelée division euclidienne. 
Rappelons la définition de la division par un entier b > 0. 

Écrivons dans l’ordre les multiples entiers de b : 


., —2b, —b, 0, b, 2b, ..., gb, .… où qeZ. 
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Il est clair que tout entier relatif a est compris entre deux multiples consécutifs de 
b; précisément, il y a un unique entier q € Z tel que 
gb <a < (q+1)b = gb +b. 
On a alors a — gb > 0 et a — gb < b, donc en posant r = a — qb, il vient 
a=gb+r, où 0 <7r<b. 
L'entier q s'appelle le quotient de la division euclidienne de a par b et l’entier r 
s'appelle le reste de la division. Le reste est toujours un entier positif ou nul et 


strictement inférieur au diviseur b. Pour que l’entier a soit multiple de b, il faut et 
il suffit que le reste de la division de a par b soit nul. 


Exemple. Étant donné un entier n > 0, cherchons le reste r, de la division de 3” 
par 8. Pour les premières valeurs de n, la division de 3” par 8 s'écrit : 
sin=1:3—=0xX8+3, donc r; =3; 
sin=2:3 =9—1x8+1, donc r = 1; 
in=sñtiJ=ixkT =NIxX8+ 1)=3xX8+3,; donc rm =3,. 
Il semble que les restes prennent successivement les valeurs 3 et 1. Pour vérifier 
cela, il suffit de montrer que l’on a rh+2 = rx pour tout n. 
La division euclidienne de 3" par 8 s'écrit 3° — 8q» +7», où qn désigne le quotient. 
Multiplions cette égalité par 3 ; il vient 


BU = 837 = 3° (8qn) + Srn = 88° qn) + Ba + ln = 88° qn + Ta) + Ta 
On en déduit que r, est aussi le reste de la division de 3"*? par 8, donc on a 
l'égalité r»42 = rn. Puisque r1 =3 et r2 = 1, on en déduit que r, =3 si n est impair 
et que r, — 1 si n est pair. 


2.3 Les nombres décimaux 


Un nombre décimal est le produit d’un entier relatif et d’une puissance de 10. Par 
exemple, 12 x 10% — 0,012, 1234 x 10°! — 123,4 et (—3) x 10? = —300 sont des 
nombres décimaux. Pour avoir les chiffres d’un nombre décimal al0?, où a est un 
entier, il suffit de décaler les chiffres de a de p places vers la gauche si l’entier p est 
positif, vers la droite si p est négatif. L'écriture décimale d’un nombre décimal ne 
comporte donc qu’un nombre fini de chiffres; ce sont les unités dans l'échelle des 
puissances positives ou négatives de 10. Ainsi par exemple 
308705 x 1074 = 30,8705 = 3 x 10 + 8 x 107! +7 x 10 ? +5 x 10 4. 

Un nombre décimal positif est la somme de sa partie entière et d’un nombre décimal 
a tel que 0 < a < 1, donc l'écriture décimale de a est de la forme a = 0,cic2-::c. 
Puisque 10a = c,c--:-c,, la première décimale c; est la partie entière du nombre 


ai = 10a. Si l’on pose a = 10a — c1, alors © est la partie entière de 10a2. On calcule 
ainsi de proche en proche les décimales selon l'algorithme suivant : 
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Algorithme de calcul des décimales 
initialisation : (L + liste vide) (a <— un nombre décimal tel que 0 <a<1) (x+ à) 
boucle : tant que x # 0 : 

c+ partie entière de 10x 

x 10x—c 

L+ L,c (on ajoute le chiffre c à la liste L) 


L'ordre sur les décimaux. Considérons des nombres décimaux a —0,c-:-c, et 
a'—0,c:-.c, compris strictement entre 0 et 1 (on a écrit le même nombre de 
décimales en ajoutant éventuellement des zéros). Supposons que a et a diffèrent 
seulement à partir de la k-ième décimale, les décimales précédentes étant égales ; 
alors on a : a < a! si et seulement si € < Ce Par exemple, on a 


0,01 — 0,01000 < 0,12339 — 0,12339000 < 0,12339001 < 0,123392 < 0,123400. 


Si deux nombres décimaux ont des parties entières différentes, le plus grand est celui 
qui a la plus grande partie entière. 


Densité des nombres décimaux. Si a est un nombre décimal, alors pour tout 
entier naturel n, le nombre a’ = a +107” est décimal. En choisissant n assez grand, 
l'écart a —a=10 ” peut être rendu aussi petit que l’on veut. Il y a donc des nombres 
décimaux différents de a et aussi près qu'on veut de a. 


2.4 Les nombres réels 


Une définition des nombres réels 

Un nombre réel est de manière naturelle une limite de nombres décimaux. Soit 
a[1],a[2],...,afn],... des nombres décimaux positifs ; leurs écritures décimales sont 
de la forme 


afn] = efn], afnjen]--: cn]: 

L'entier naturel efn] est la partie entière de afn] et les chiffres c1[n],c2{[n],... sont les 
décimales de afn]; on a terminé chaque écriture par des points de suspension pour 
éviter de préciser le nombre de chiffres, mais chacun des nombres afn] n’a qu’un 
nombre fini de décimales non nulles. 

Supposons que la suite des nombres a[1],a[2],...,afn],... est décroissante, c’est-à-dire 
que l’on a afn] > afn +1] > 0 pour tout n. 

Les parties entières vérifient donc e[1] > e[2] >--->e[n]---; puisque les e[n] sont des 
entiers naturels, la suite e[1],e[2],...,efn],... finit par stationner à une valeur e, c’est- 
à-dire que pour tout entier n supérieur ou égal un certain rang N,, on a e[n]=e. Pour 
n > No, on a efn+1]=efn] et afn] > a[n +1], donc les premières décimales vérifient 
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ci[n] > cn +1] pour tout n > No. En prenant la première décimale de chaque terme, 
on obtient après le rang No une suite décroissante d’entiers naturels : après un certain 
rang N., la suite des entiers c[n] est donc stationnaire à une valeur c,. Ainsi on a 


(a No — €, a[No]c [Mo] US Cp[Nol DE 


a[N] = e,cc[N]..-c [Ni]... 


afn] = e, cicofn]:-:c[n]-:: 
autrement dit an] = e,cc[n]---c,[n]--: pour tout n > M. 
Pour n > N., l'inégalité afn] > aln +1] implique de même, pour les deuxièmes déci- 
males, que l’on a fn] > c[n+1];il y a donc un rang AN après lequel les deuxièmes 
décimales gardent la même valeur c. 
D'une manière générale, pour tout entier naturel p, il existe un rang N, après lequel les 
p premières décimales restent fixes : pour tout n > N,, on a a[n]=e,cic2---cpcpyin]-., 
où les chiffres c1,c,...,c, ne dépendent plus de n pourvu que n > N,. 
Pour tout entier p > 1, on définit ainsi un chiffre c, et l’on est conduit à convenir 
que l'écriture e,C1C2:::C,:-:: représente un nombre c, bien que cette écriture puisse 
présenter une infinité de chiffres non nuls. Le nombre c n’est pas décimal en général, 
mais les nombres décimaux afn] approchent c de mieux en mieux : en effet, pour 
n > N,, les deux nombres décimaux afn] et e,c1c2-::c, ont mêmes p premières 
décimales, donc l'écart a[n] — c est moindre que 107? ; puisque le nombre 107? peut 
être rendu aussi petit qu’on veut en choisissant p assez grand, on dit que /a suite 
des nombres afn] a pour limite c, ce qu’on écrit sous la forme 


lim (afn]) = c 
Par définition, les nombres ainsi obtenus comme limite d’une suite décroissante de 
nombres décimaux positifs sont les nombres réels positifs ou nuls. Un nombre réel 


possède en général une infinité de décimales non nulles : on dit que son écriture 
décimale est illimitée. 


Exemple. Posons a[1] — 2/10 et définissons une suite en posant 
afn + 1] = (ain])” + (1/10) pour tout n > 1. 

Le nombre a[l] est décimal et comme la somme et le produit de deux décimaux 
sont décimaux, tous les nombres afn] sont décimaux. 

Montrons que la suite des afn] est décroissante, c’est-à-dire que l’on a afn +1] < afn] 
pour tout entier n > 1. Nous raisonnons par récurrence. Puisque a[2]=(2/10)?+1/10=— 
0,14, on a bien a[2] < a[1]. Supposons que n est un entier tel que afn + 1] < afn]. 
Puisque les nombres an] sont tous positifs, il vient (an +1])” < (afn]) donc 
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a[n + 2] = (afn + 1])° +1/10 < (a[n])° + 1/10 = afn +1]. D'après le principe de récur- 
rence, on en déduit que l'inégalité a[n+1]< afn] est vraie quel que soit l’entier n > 1. 
La liste ci-contre donne les premières valeurs approchées des 


nombres a(n) : la limite des afn] est le nombre réel c dont de _ a 
les premières décimales sont 0,112701665: -- On peut calcu- a[3] = 0,1196000000 
ler algébriquement le nombre c : en effet, faisons tendre n  a[4] = 0,1143041600 
vers l'infini dans l'égalité a[n+1]=(a[n])"+(1/10) ; puisque 45] = 0,1130654409 
afn] tend vers c, (afn])” tend vers c? et comme afn +1] ASIE O2 TS S 708 
tend vers c, on obtient Ne eee 
É : a[8] = 0,1127058399 
c=c+1/10 al9] = 0,1127026063 

ou encore €? — € + 1/10 = 0. L'équation du second degré  a[10] = 0,1127018774 
x?—x+1/10 a pour discriminant 1—(4/10)=—3/5 et pour ra- 4alll] = 0,1127017131 
cines les nombres réels (1/2)(1+4/3/5) et (1/2)(1—-,/3/5). 1e Sr on 
Puisqu'on a les inégalités ee ti 
a[14] = 0,1127016650 

D<e<1/2 <(1/2)(1+4/3/5), a[15] = 0,1127016655 

a[16] = 0,1127016654 


on en déduit c=(1/2)(1-:/3/5)= 


que V15 n’est pas un nombre décimal, par suite le nombre c n’est pas décimal. 


. On peut montrer 


5—V15 
10 


Propriétés des nombres réels 


L'ensemble des nombres réels se note R. Rappelons que l’on peut faire la somme, la 
différence et le produit de deux nombres réels ; on peut aussi diviser par un nombre 
réel non nul, ce qui a pour conséquence la règle : 


si a et b sont des nombres réels tels que ab — 0, alors a — 0 ou b— 0. 


L'ordre sur les nombres réels. La comparaison entre deux nombres réels se 
définit comme pour les nombres décimaux : par exemple, si des nombres réels 
c=0,cic.--c ic. et =0,cc.-.cx 10, ne diffèrent qu’à partir de la k-ième 
décimale, alors : c<c/ si et seulement si c, <c,.. On a aussi la définition plus algébrique : 
c < c’ si et seulement si © —c > 0. 
Si a est un nombre réel, il existe des nombres réels différents de a et aussi près 
qu'on veut de a, par exemple les nombres a +10” pour n assez grand. Rappelons 
quelques définitions : 


Définitions 

La partie entière d'un nombre réel a est l’entier (positif ou négatif) noté E{(a), 
tel que E(a) < a < E(a) +1. 

- Soient a et b des nombres réels tels que a < b. L'intervalle ouvert |a,b[ est l’en- 
semble des nombres réels x tels que a < x < b. L'intervalle fermé [a,b], appelé 
aussi segment, est l’ensemble des nombres réels x tels que a < x < b. 
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Si a et b sont des nombres réels, on définit de manière analogue les intervalles 
la, b], [a,b[, Ja, +oo, [a, +oof, ]—0o, b[, ]—-00, b] et l’on pose ]—-00,+00[ = R. 


Voici les principales règles de calcul sur les inégalités entre nombres réels : 


a < b si et seulement si a+x<b+x 
sia<bet a <Ÿ, alors a+a <b+b 
si x > 0, alors on a : a < b si et seulement si ax < bx 
si x < 0, alors on a : a < b si et seulement si bx < ax 
pour des nombres a et b de même signe, on a : a < b si et seulement si 1/b < 1/a. 


2.5 Les nombres rationnels 


On appelle nombre rationnel le résultat de la division d’un nombre entier par un (autre) 
nombre entier non nul. Tout nombre décimal est rationnel, mais le nombre rationnel 
4/3=1,33---3-.. n’est pas décimal puisqu'il a une infinité de décimales non nulles. 
L'ensemble des nombres rationnels se note Q. On a donc les inclusions d’ensembles 


NCZCQCRK. 


On a souvent besoin d'approcher un nombre réel positif par des nombres rationnels. Si 
l'écriture décimale d’un nombre réel positif a est e,c1C2:--cn:-:, alors en ne retenant 
que les premières décimales, on obtient des nombres décimaux afk] = e,c1c2---cx 
vérifiant a[k] < a < a[k] + 10-F : chaque nombre décimal a[k] approche a à 107" 
près. Posons ux = 10*(0,c1c2:::cx) = cC2---c4. Le nombre uy est un entier et l’on 
a ak] =e+0,cc.-.cx = Der 


en général une fraction dont le dénominateur est 10. 


. L’approximation décimale à 10-* près est donc 


Meilleure approximation d'un nombre réel par des rationnels 
Décrivons, sans la justifier, une méthode pour trouver des nombres rationnels à petits 
dénominateurs qui approchent rapidement un nombre réel a > 0. On suppose a non 
rationnel. 

Posons ao = E(a). Puisque a n’est pas entier, le nombre a — a n’est pas nul et l’on 


peut définir un nombre x; en posant a = ao + _ Puisqu’on a 0 <a— ao <1, il vient 
Ti 
æ1 > 1. Le nombre x, n’est pas entier, sinon a serait rationnel comme somme d’un 
entier et d’un rationnel. En posant a = E(x1), on a donc 0 < +1 — ai < 1 et l’on peut 
définir un nombre %2 > 1 tel que %1 = ai + Le, On continue ainsi, selon l'algorithme : 
T2 


a=æ@+—, où ao = E(a) 


T1 
: 1 ve 
m=ut+—, où a =E(x) 
T2 
—_ 1 : =E 
Tn — An + ; ou An — (Zn) 
Tn+1 
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Les deux premières lignes donnent a = ao + 1 ao + L et l’on obtient ensuite 
T1 1 + — 
T2 
les expressions suivantes, appelées développement de a en fractions continuées : 
a — ao + 1 I ,  a—=@p+ L ï 
ee TUE 
Q + QE —— 
T4 


Les nombres a; sont des entiers positifs et les x; sont des nombres réels plus grand 
que 1. Tronquons ces expressions en posant 


bo— &@o , bi = a0 + + : ba = a9+ — , 
a Qi + — 
a2 
Les nombres bo, b1,b2,... sont rationnels, car la somme et le produit de deux ra- 


tionnels est rationnel et l'inverse d’un rationnel non nul est rationnel. On démontre 
que la suite des nombres b,, a pour limite a. Posons b, — , où p, et 4, sont des 


n 


entiers. Ces fractions ont une propriété remarquable : parmi les fractions l telles 
q 


que q < Qn, la fraction b,, — _ est la plus proche de a. En ce sens, les rationnels 
q 


1" constituent la meilleure approximation du nombre a par des fractions. Ce qualificatif 


n 


exprime que l’approximation est bonne bien que le dénominateur soit petit. 


Exemple 1. Pour le nombre 7, on a les égalités : 


Tr =3+ _ , où 1 = 7,06251330593104576979300515255 - .- 
nm =7+ = , où 2 = 15,9965944066857198889230604100 - -- 
to =15+ . , où æ3 = 1,00341723101337260346414717001 - 
zs=1+ . , où 24 = 292,634591014395472378544147738 - 


d’où les meilleures approximations rationnelles de r : 


bo — 3 
bi, = 3+7 = _ æ3,142::: (les deux premières décimales sont celles de 7) 
bo = 3+ Le. 3+ 15 _ 333 Z 3,14150:-: (quatre décimales exactes) 
74 L 106 106 
eu 
15 
b3 = 3+ 1 = 3+ 16 _ 355 © 3,1415929 --. (six décimales exactes). 
74 1 it: Le 
1542 
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Exemple 2. En acoustique, on appelle intervalle entre deux sons le rapport de leurs 
fréquences : si des fréquences fi, fi, f2, f, vérifient f1/f1 = f2/f;, alors entre les sons 
de fréquences f. et f, l'oreille perçoit le même intervalle qu'entre les sons de fré- 
quences f, et f,. Une note de musique de fréquence f s'accompagne d’harmoniques 
de fréquences 2f,3f,... et les notes de fréquences f et 2f sont perçues comme ‘les 
mêmes”, jouées avec un écart d’une octave. L’intervalle entre les fréquences 2f et 3f 
s'appelle une quinte. Pour créer une gamme, c’est-à-dire pour découper les octaves en 
intervalles dont les multiples permettent suffisamment d'accords avec les quintes, on 
est amené à chercher de petits entiers naturels p et q tels que p quintes valent à peu 
près q octaves. Cette condition signifie que (3/2)? est peu différent de 21, ou encore 


que le rapport 2/*4/3P est proche de 1. En prenant le logarithme, cela se traduit par : 


(p + q)In2 peu différent de pln3, ou encore . peu différent de la fraction —. 
Cherchons donc les premières bonnes approximations rationnelles du nombre ou 
n 
L = 1,58496250072115618145373894394 . -. = 1 + (1/x:) 
n 
x1 = 1,70951129135145477697619026217 - - - = 1 + (1/x2) 
x = 1,40942083965320900458240433081 - - - = 1 + (1/x3) 
za = 2,44247459618085927548717403238 - - . = 2 + (1/x1) 
za = 2,26001675267082453593127612260 - :: = 2 + (1/x5) 
25 = 3,84590604154639953522819708395 . : = 3+ (1/x6) , où x > 1 
d’où les approximations suivantes de _ » 
n 
b3 = 1 + L. =È ; ba = 1 + L = 19 et bs = 65. 
1+ à si LE —_— 12 41 
LE 1 + PES 
2 2e 


Avec l’approximation - on obtient une gamme où cinq quintes sont équivalentes à 


trois octaves. Si fo est la fréquence de base d’une octave, on montre que les notes 


successives ont pour fréquence fo, f1 = à fo, 2 = fo 3 = . Jo, fa = n fo:ilya 
donc cinq notes par octave. Entre deux sons successifs, il n’y a que deux intervalles 


possibles, car f1//fo — f3/f2 = 2f0/fa — 9/8 et f2/ fi = fa/ fs = 32/27 ; ces notes cor- 
respondent à peu près aux touches noires du piano. 


Avec l’approximation . on obtient une gamme chromatique, plus riche, où douze 


quintes valent sept octaves ; elle contient douze notes. 
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3. Les fonctions 
3.1 Notion générale de fonction 


Soient Æ et F des ensembles. Une application ou une fonction de E dans Fest une 
règle qui permet d'associer à chaque élément x € E un élément parfaitement dé- 
terminé de F. Il est souvent utile de nommer la fonction : lorsqu'on a défini une 
fonction f de E dans F, on note f(x) l'élément de F associé à x par la fonction 
et l’on dit que f(x) est l’image de x par la fonction f. La fonction elle-même se 
note f : E — F ou encore x + f(x) ; l'ensemble E s'appelle l’ensemble de départ ou 


le domaine de définition de f ; l'ensemble F' est l’ensemble d'arrivée de f. 


Egalité de deux fonctions. Des fonctions f et g sont égales si et seulement si 
elles ont le même ensemble de départ, le même ensemble d'arrivée et si l'on a 
f(x) = g(x) pour tout x appartenant à l’ensemble de départ. 


Fonction constante. Une fonction f : E — F est constante si l’on a f(x) = f(y) 
pour tous éléments x et y appartenant à Æ ; il revient au même de dire qu’il existe 
un élément b € F tel que f(x) = b quel que soit ve E. 


Exemples 


1) Supposons que des variables réelles u et v sont liées par la relation u? + 4u? = 1. 
Si l’on calcule v en fonction de uw, on obtient 


la formule v — + VI, valable pour les va- 1 p! . fi(u) 
leurs de uw telles que —1 <u < 1. Cela permet 

de définir deux fonctions exprimant v au moyen 1 
de u : la fonction f, :[-1,1] —R définie par “ 
fi(u) = VI et la fonction f_:[-1,1] —R Fa) 


définie par f_(u) = vi —u?. Mais la relation 
u? + 4v? = 1 ne définit pas v comme fonction de u, car à une valeur de u 


appartenant à |—-1,1[ correspond deux valeurs opposées de w. 

2)]Notons P la pression, V le volume et 7° la température absolue d’une masse 
gazeuse donnée. En première approximation, le rapport — reste égal à une 
constante k. Cette relation permet de définir plusieurs fonctions. 


Si le volume V reste constant, la pression est fonction de la température selon 
la loi T + P(T) définie par P(T) = (k/V)T. Les quantités P(T) et T sont alors 
proportionnelles : on dit que la fonction P est linéaire. 

— À température constante, la pression est fonction du volume : cela définit une 
fonction p:Vr + Les quantités p(V) et V sont inversement proportionnelles. 

— La température est fonction à la fois du volume et de la pression, ce qui dé- 


finit la fonction de deux variables T:(P,V)+ É ; les quantités P et V 
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sont des nombres réels positifs, donc la fonction T' est définie sur l’ensemble 


]0,+co[x]0,+co0|[ des couples de nombres réels positifs. 


Définition 

Soit f:E — F une application. Si À est une partie de l’ensemble de départ E,, l’en- 
semble des éléments de F° de la forme f(x), où x parcourt la partie À, s'appelle 
l'image de la partie À et se note f(A). L'image de l’ensemble de départ, c’est-à-dire 
l’ensemble f(E) de tous les éléments de la forme f(x), s'appelle l'image de f. 


L'image d’une partie de l’ensemble de départ est une partie de l’ensemble d'arrivée. 


Il ne faut pas confondre 
— l’image d’un élément x : c’est l'élément f(x) appartenant à l’ensemble d'arrivée, 


- l’image d’une partie À : c'est une partie de l’ensemble d'arrivée. 


Exemples 


— Si f:R—R est la fonction x + x?, alors f([2,3]) —[4,9[, f([-2,3]) = [0,9] et 
pour tout nombre a < 0, on a f([a,+co[) = [0,+oo[ (figure 1). L'image de f est 
l'intervalle [0, +oo|. 

L'image de la fonction sinus est le segment [—1,1]. Puisque sinus a pour pé- 
riode 27, on obtient toute l’image en prenant seulement les valeurs sinx quand 
x parcourt un intervalle de longueur 27 : pour tout nombre réel a, on a donc 
sin([a,a+2r|) = [-1,1]. 

La figure 2 montre le graphe de la fonction u : R — R qui à x associe x° — 3x : 
l'image par u de [-1,1] est [—2,2] et l’image de l'application uw est R. 

- Définissons une fonction g : R? — R? en posant g(x,y) = (x? +1,e”). Les nombres 
de la forme x? + 1 sont tous les nombres supérieurs ou égaux à 1; les nombres 
qui peuvent s'écrire e” sont les nombres strictement positifs : l’image de g est 
donc la partie [1,+o0[x]0,+c[ de R? (figure 3). 


figure 1 figure 2 figure 3 
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Composée de deux fonctions. Soit f : E — F une fonction et soit g: F — G 
une fonction définie sur l’ensemble F d’arrivée de f. Pour tout xEE,ona f(x)eF, 
donc g(f(x)) est un élément bien défini de l’ensemble G:. L'association x + g(f(x)) 
est donc une fonction de E dans G. 


Définition 
La fonction de E dans G& qui à tout x € E associe l'élément g( f (x)) s'appelle la 
composée des fonctions f et g et se note go f:E —G. 


Si l’on a encore une fonction h : G — H, les composées 


o ho 
ho(gof}: EG y et (hogjof: ET Fr *%# 
sont des fonctions de Æ dans H. Comme on a l'égalité (ho g)o f(x) =ho(go f)(x) 
pour tout x, les fonctions (ho g)o f et ho(go f) sont égales et l’on omet les 

parenthèses en écrivant simplement ho go f cette composée. 


Exemples 

1) Supposons qu’une quantité w dépende du temps et de la distance à un point O. 
Choisissons un repère orthonormé (O;i,3,k) d'origine ©. Cela définit une fonction 
w:(x,y,2,t)r w(x,y,2,t), où t est la variable temps et x,y,2 les coordonnées spa- 


tiales. Comme w ne dépend que de t et de la distance r(x,y, 2) = 4/2? + y? + 2? 
au point O, posons f(r,t) = w(x,y,2,t) : la fonction f n’a que deux variables et 
w est la composée w = f o g, avec g(x,y,2,t) = (4/2? + y? + 22,6) : 


RxR + RXxR RXR À R 


y 


2) Posons f(x,y) = mp où x et y sont des nombres réels strictement positifs : cela 
T'TY 
définit une fonction f : E — R, où E = ]0,+c{x]0,+o0|. En divisant numérateur 
RE oi x /y t | — 
et dénominateur par y, il vient f(x — — , Où t = x/y. Ainsi 
par y f(x, y) He /y 


les valeurs f(x,y) ne dépendent que du rapport x/y. Si l’on définit la fonction 


u : [0,+co[ — R en posant u(t) = a alors on a f(x,y) = u(x/y), autrement 
dit f est la composée f = uo g, où g : E — ]0,+c| est définie par g(x,y) = x/y. 
Quand les valeurs w(x,y) d'une fonction ne dépendent que du rapport x/y (comme 
c'est le cas pour f), on dit que la fonction 4 est homogène. 

3) Définissons des fonctions de R dans R en posant f(x) = x? et g(x) = x +1 : 
on a g(f(x)) = x? +1 et f(g(x)) = (x +1)?, donc fogZ£go f. Dans le cas où 
les composées f o g et go f sont toutes les deux définies, on voit qu’en général, 
l’ordre de composition compte. 


Rappelons les définitions relatives aux fonctions monotones. 
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Définitions 

Soit f une fonction à valeurs réelles définie sur une partie de l’ensemble KR. 

— f est croissante si, pour tous nombres x et y appartenant à l’ensemble de départ 
et vérifiant x < y, on a f(x) < f(y); 

— f strictement croissante si, pour tous nombres x et y appartenant à l’ensemble 
de départ et vérifiant x < y, on a f(x) < f(y). 

> On définit de même une fonction décroissante et une fonction strictement décrois- 
sante. 


La composée de deux fonctions croissantes est croissante, de même que la compo- 
sée de deux fonctions décroissantes. Si l’on compose une fonction croissante et une 
fonction décroissante, on obtient une fonction décroissante. 


3.2 Transformation et itération 


Une fonction f : £ — E s'appelle une transformation de E. 

Si f est une transformation de Æ, alors pour tout élément x de Æ, l'élément 
x1 = f(xo) appartient encore à Æ et l’on peut définir les éléments 2 — f(x), 
ta = f(x2), etc. On forme ainsi les itérés t1,22,...,æn,... de x par la transformation 
f : ils sont définis de proche en proche par la relation 


pour tout entier n Z0, %Tnr1 = flan): 


La transformation 20 + x, est réalisée par la fonction composée f o fo.-.0 f, que 
ns —] 


l’on note f:E — EF. n fois 


Définition 
Si f:E — E est une transformation, un élément x € E tel que f(x) = x s'appelle 
un point fixe de f. 


Si x est un point fixe de f, tous les itérés de x sont égaux à x. 


Exemple 1. Reprenons les nombres a, définis (exemple page 7) par les relations 
ao = 2/10 et an+1 = a? + (1/10) pour tout entier n > 0. En posant f(x) = x? +(1/10), 
on obtient une fonction f : ]0,+co[ — ]0,+oo{ et les nombres a, sont les itérés par 
f du nombre 2/10. 

Les points fixes de f sont par définition les nombres 
positifs solutions de l'équation x? + (1/10) — x. Puisque 
les solutions (1/2)(1+4/3/5) et (1/2)(1—,/3/5) sont 
des nombres positifs, ce sont les deux points fixes de 
f. Dans l'exemple, nous avions observé que les itérés 
de ao tendent vers l’un des points fixes de f. 

La figure ci-contre montre la courbe d’équation y= f(x) 
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et la droite d’équation y = x sur l'intervalle [0,2/10]. On y a construit une ligne brisée 
formée de segments alternativement horizontaux et verticaux, de la manière suivante : 


— le segment vertical le plus à droite est à l’abscisse ap = 2/10, donc coupe le graphe 
de f au point d’ordonnée f(ao) = «1 ; 

— le segment horizontal qui suit est à l’ordonnée a:, valeur qu’on reporte sur l’axe 
des abscisses en passant par la bissectrice y — x : on a visiblement a; < @ ; 

le segment vertical d’abscisse a; coupe le graphe de f au point d’ordonnée 
f(a1) = a; reportons cette valeur a2 sur l’axe des abscisses comme on l’a fait 
pour &1 : on observe que a2 < &1. 


Cette construction permet de visualiser sur l'axe des x l’évolution des itérés de 
ao : la suite des nombres a, est décroissante et sa limite est l’abscisse { du point 
d'intersection de la courbe et de la bissectrice y = x. On a bien l'égalité { = f(4) 
qui traduit que { est un point fixe de f. Le seul point fixe de f inférieur à ao est 


(1/2)(1—4/3/5), par conséquent £ = (1/2)(1—,/3/5). 


Exemple 2. Soient a et b des nombres réels et soit f : R — R la fonction définie 

par f(x) = ax + b. 

Sia=1et b=0,ona f(x) = x pour tout x, donc tous les nombres réels sont des 

points fixes de f. Si a=1et bZÆ0,ona f(x) =x+b donc il n’y a aucun point fixe. 

Supposons a Z 1. Un nombre x est point fixe de f si et seulement si ax+b= 7x, 

ce qui équivaut à (1 — a)x = b. L’unique point fixe est donc w — b/(1 — a). 

On a f(x) — f(w) = ax + b— (aw + b) = a(x —w) et puisque f(w) = w, il vient 
f(x) —w = a(x —w) pour tout x. 


Donnons-nous un nombre réel x, et exprimons les itérés %1 = axo +b , %x2 = 
ax1+b,..., nan _1+0 de tp. Ona ti —-w—=a(to-w), To—w—=a(r; -w)=a?(x5-w) 
et en général 

Tn —w = Q"(xo —w) pour tout entier n > 1, 


formule qui s'écrit encore 
1 nm 


Tn = d°to +w(1— a") = a°xo + b . 
— à 


Exemple 3. Dans des conditions stables, deux espèces A et B de bactéries vivent 
en symbiose à des concentrations moyennes a et b. On déplace l'équilibre en aug- 
mentant de 18% la concentration de A et de 12% celle de B, puis on mesure chaque 
jour l'écart à la moyenne des concentrations de chaque espèce. Au bout de n jours, 
l'écart pour la bactérie A, en pourcentage de a, vaut x, et pour la bactérie B, il vaut 
Yn. Après modélisation, on est conduit à la loi d'évolution suivante : 


{ Enx1 = (1/5)(37n — 6Yn) 


avec zo = 0,18 et yo — 0,12 d’après nos conditions initiales. 
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Les couples (tz»,yn) sont les itérés de (x0,%o) par la fonction f : R? — IR? définie par 
f(ay)=(XY), où X = = (x — 6y) et Y = = (22 + 3). 
On vérifie facilement que le seul point fixe 
de f est (0,0) : cela veut dire que les con- 
centrations de A et B ne peuvent rester en 
équilibre que pour les valeurs a et b. 
Le graphique ci-contre montre les points M 
Mo=(x0,%),Mi=(r1,y1),.. ., M30—(x30,ÿ30) : 
ils se situent sur une courbe en spirale qui 
entoure l’origine et s’en rapproche, x, et y» 
pouvant prendre des valeurs positives ou 
négatives. Observons la distance à l’origine M3 
d’un point M, : elle n’est pas décroissante 
mais semble cependant tendre vers 0, ce qui 
indique que M, tend vers l'origine quand M. f M; 
n tend vers l'infini. 
Pour mesurer l'éloignement à l'origine d’un point (x,y), nous allons utiliser une 
fonction ô(x,y) = x? +ey?, où e > 0. Si d est un nombre positif, les points (x,y) tels 
que Ô(x,y) = d, c'est-à-dire la courbe d’équation x? + ey? — d, est une ellipse centrée 
à l’origine (exemple 1 page 22). Les points (x,y) tels que ô(x,y) < d sont à l’intérieur 
de l’ellipse et plus d est petit, plus ces points sont proches de l’origine : ô(x,y) peut 
donc servir à mesurer l'éloignement à l’origine. Remarquons que si l’on choisit e=1, 


M 


Y = 


Bd 
[=] 


(x, y) est le carré de la distance à l’origine et les ellipses sont des cercles. 
Comparons les nombres ô(X,Y) et ô(x, y). 


OX, Y)—6(x, y) = X?+eY?-r?-ey? = _ ((3x 6y)? + e(2x+3y)"—25x°—25ey°) 
= 5 (4(e — 4)x° + 12(—3 + e)ry + 4(9 — 4e)y°). 
Choisissons e — 3. Il vient 
il 2 2 4 ,,.2 2 4 
O(X, Y') — Ô(: = —(—-4x" — 12 = —— 3y*) = — —0Ô 
(AY) — 6(e,y) = SE (4e — 12) = — (a + 897) = — 6x9), 


d'où 0(X, Ÿ) = 2 O(æ, y) = 0,840(x,y) et finalement 
O(Tn+1, Yn+1) = (0,84) O(tn,Yn) pour tout n. 


La suite des nombres ô(x,,Yn) est géométrique, de premier terme 0(x0, Yo) = 
(0,18, 0,12) = 0,0756 et de raison 0,84, de sorte que 


O(Xn;Yn) = (0,84)" O(xo, Yo) pour tout n. 


Puisque le nombre 0,84 est strictement inférieur à 1, les puissances (0,84) tendent 
vers 0 et O(T%n,Yn) aussi. Remarquons que l’on a |x| < /x° + 3y? et |y| < 4/2? + 3w?, 
donc |tn| < 4/0(%n,Yn) et [Un| < V0(Xn; Yn). Il s'ensuit que les nombres x, et yn 


tendent vers 0. 
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Les concentrations des bactéries À et B reviennent donc vers les valeurs d'équilibre 
a et b en fluctuant autour de cet équilibre. On peut estimer la vitesse de retour vers 
l'équilibre en cherchant n pour que |x,| et |[y,| soient, par exemple, inférieurs à 107? : 
il suffit pour cela que l’on ait ô(æ,,Yn) < 107, ou encore (0,84) x 0,0756 < 1074. 
En prenant le logarithme, cette inégalité devient n1n(0,84) + In(0,0756) < —4 n(10) 
4n(10) +In(0,0756) _ 2 61... d'où n > 30. 

— In(0,84) 


c'est-à-dire n > 


Exemple 4. Dans un secteur de production, on diminue chaque année de 20% 
la pollution produite, mais parallèlement le coût énergétique présente une variation 
relative 0,25 — 0,6/r, où r est le rapport coût sur pollution, mesuré à l’aide d'unités 
convenables. À une certaine date, on mesure une pollution annuelle p, et un coût 
correspondant €. Comment évolueront la pollution produite et le coût en énergie ? 


Notons », la pollution produite pendant la n-ième année et c, le coût énergétique. 


Le taux HER est égal à —0,2. Si l’on note r, le rapport c,/pn, alors le taux 
Cn — Cn 2 s 
HT est égal à 0,25 — 0,6/rA. 

Cn 


: Pn+1 —P 
é nm LEE 


Exprimons le couple (p1+:1,Cn+1) au moyen de (p»,c»). L'égalit —0,2 


conduit à Pn+1 —0,8p, et puisqu'on a ur 0,25 — 0,6(ph/cn), il vient Cn+1 = 
Cn 
1,25c, — 0,6p,. On a donc le système d'égalités 


. = 0,8Pn 


Cn+1 = 1,25Cn — 0,6Ph 
Si l’on définit la fonction f:R?—1R? en posant f(p,c)=(0,8p , 1,25c—0,6p), ces égalités 
expriment que les couples (p,,c,) sont les itérés du couple (po,c) par la fonction f. 
D'après la première égalité, p, suit une progression géométrique : on a donc 
(1) Pn = (0,8)"po 
En divisant membre à membre les égalités du système, il vient 
nn. Cn+1 _ 1,25Cn  0,6p» 12,5 ke 0,6 95 +, 3 | 
Pn+1 0,8pn  0,8Pn 8 0,8 16 4 
Les nombres r, s’obtiennent en itérant la fonction r + (25/16)r — (3/4) ; comme 
dans l'exemple 2, on a donc 


25/16)" —1 
Tn = (25/16)"ro — (3/4) Te = (25/16)"ro — (4/3)[(25/16)"—1]. 
Multiplions par p, —(0,8)"po en remarquant que l’on a 0,8 x (25/16)=—0,05 x25—1,25 : 
(2) Cn = (1,25)"co — (4/3)[(1,25)"—(0,8)"]p0 . 


Sur la figure ci-après, nous avons représenté les points de coordonnées (p,,c,) pour 
les premières valeurs de n, avec différentes données initiales po et co. 
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Pour calculer l'équation de la courbe où se trou- 
vent les points (ph,cn), éliminons n entre les 
expressions données en (1) et (2). On a (0,8)"— 
Pn/po et comme 1,25 x 0,8 — 1, il vient (1,25)" — 
Po/Pn- D'où 
Po d 4 Ë Pn 
Pn 3 |[Pn Do 
(3Cn — 4pn)Pn = (300 — 4po)po 


Ainsi la quantité (3c; — 4p,)p, reste constante 


__ Po | 4 | 4 
+ nm 
| po = Co 3 Po 3 D 


au cours de l'itération, autrement dit les points 
(PnCn) Sont sur la courbe d’équation (3c—4p)p=— 
k, où k = (3co — Apo)po. En prenant p comme 
variable, il vient c(p) = (1/3)(4p + k/p), la fonc- 
tion c étant définie sur ]0,+oco[. La dérivée est 
cp) = (1/3)(4— k/p°). 


Premier cas : 3Co > 4po. On a alors k>0, la dérivée s’annule si 4p?=k, c’est-à-dire 


si p= VE /2, d'où le tableau de variations : 


p |0 Vk/2 


+ 00 


ap} |. A 


Puisque la pollution diminue chaque année, la courbe est parcourue dans le sens 


des abscisses décroissantes et la pollution tend vers 0. En supposant po > VE /2, 


c'est-à-dire 4po > 3c0/2, le coût commence par diminuer jusqu’à la valeur mi- 


nimum c(Vk/2), puis augmente et tend vers l'infini. Si n est l’entier tel que 


Pni1 < VE/ 2 < ph, le coût minimum est obtenu la (n+1)-ième année. 


Deuxième cas : 3co < 4po. La constante k est négative, la dérivée c’(p) est stricte- 


ment positive et la fonction pr c(p) est strictement croissante. Quand p tend vers 


0, c(p) tend vers — et quand p tend vers +co, c(p) tend vers +oco. Puisque la 


courbe est parcourue dans le sens des abscisses décroissantes, on atteint ainsi un 


point où c—0, ce qui est irréaliste car le coût énergétique est une quantité positive. 


Troisième cas : 3Co — 4po. Les valeurs de © et de » étant le résultat de mesures, 


l'égalité 3co — 4po n’est sûrement pas réalisée exactement : il s’agit d’un cas li- 


mite. D'un point de vue mathématique, on a alors c(p) — (4/3)p : la courbe est la 


demi-droite de pente 4/3 passant par l’origine. Le rapport c,,/p, reste égal à 4/3 


et les points de coordonnées (p,,,c,) tendent vers l’origine quand n tend vers +0. 
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3.3 Notion d'antécédent, application bijective 


Définition 
Soit f : £ — F une application. Si b est un élément de F', alors tout élément xe E 
tel que f(x) = b s'appelle un antécédent de b par l'application f. 


Si b est un élément de l’ensemble d'arrivée, résoudre l'équation f(x) — b, c'est 
chercher tous les antécédents de b. 

Pour qu’un élément b € F ait au moins un antécédent par f, il faut et il suffit 
que b appartienne à l’image de f. 


Exemples 


1} Considérons la fonction valeur absolue x+ [x]. Si b est un nombre réel strictement 
positif, alors l’équation |x| — b possède deux solutions b et —b, donc b a deux 
antécédents. Un nombre strictement négatif n’a pas d’antécédent. Le nombre 0 a 
pour seul antécédent 0. 

2) Donnons-nous un nombre réel b et étudions l'équation sin x — b. Si [b| > 1, cette 
équation n’a pas de solution, car pour tout nombre réel x, on a —-1 <sinx <1; 
un nombre de valeur absolue strictement supérieure à 1 n’a donc pas d’antécé- 
dent par la fonction sinus. Supposons |b| < 1; alors il existe un (unique) nombre 
a € [-x/2,T/2] tel que sin a = b. On a les équivalences 


sinx=b < sinx =sina (x = a+2kr ou x =7r-a+2kr), où kEZ. 


Tout nombre b E [-1,1] a donc une infinité d’antécédents par la fonction sinus. 
3) Pour tout nombre réel b € [—-1,1], l'équation sin x = b possède une seule solution 
dans l'intervalle [—-7/2,7x/2]. Si l’on définit la fonction s:[—7/2,7/2] — [-1,1] en 
posant s(x) — sinx, alors tout élément de l'intervalle [—-1,1] possède un unique 
antécédent par s. 
4) Un exemple arithmétique. Si b est un entier donné, quelles sont les façons de 
l'écrire sous la forme 5x + 7y avec x et y des entiers relatifs ? 
Définissons la fonction g:ZxZ—7Z en posant g(x,y)—5x+7y. Pour tout entier bEZ, 
on a g(3b,—2b)—5 x 3b+7 x (—2b) —b, donc le couple (3b,—2b) est un antécédent de 
b. Cherchons les autres antécédents de b. Ce sont les couples (x,y) d’entiers vérifiant 


5r+T7y=b = 5x +7y = 5(3b) +7(—-2b) = 5(x — 3b) = —7(y + 2b). 


L'entier 5(x — 3b) est multiple de 7 (car y + 2b est entier). Puisque 7 et 5 sont 
premiers entre eux, on en déduit que l’entier x — 3b est multiple de 7. On a donc 
x—3b=7k, où kEZ. Il vient 5(x —3b) = 5 x 7k = 7(—y—2b), d'où 5k = —y — 2b. 
Finalement, les antécédents de b sont les couples (3b+7k,—2b—5k), où k est un 
entier relatif quelconque. Ce sont les couples (x,y) d’entiers tels que b = 5x + 7y. 


Pour une fonction définie sur une partie de R et à valeurs réelles, l'étude du sens 
de variation renseigne sur le nombre d’antécédents d’un élément. 
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Proposition. Soit f : I —R une fonction, où I est une partie. Si f est strictement 
monotone, alors tout nombre réel a au plus un antécédent par f. 


Démonstration. Supposons par exemple que f est strictement croissante sur /. Soit b un 
nombre réel. Faisons l'hypothèse que b a un antécédent a€T. Soit x un élément de J tel que <a ; 
puisque f est strictement croissante, on a f(x) < f(a) =b, donc f(x) n’est pas égal à b, donc x 
n’est pas un antécédent de b. De même, si x>a, alors f(x)> f(a)=b et x n’est pas un antécédent 
de b. Le seul antécédent de b est donc a. Tout nombre réel a donc zéro ou un antécédent par f.m 


Partition définie par une application 


Soit f: E — F une application. Pour tout élément b € F, notons A(b) l’ensemble 
des antécédents de b par f : on a donc 


AG)= {re E| f(x) =. 
Voici des propriétés générales de ces parties A(b) de E. 
a) La réunion de toutes les parties A(b) est l'ensemble E. 


En effet, si a est un élément quelconque de E, alors a est un antécédent de l'élément 
b = f(a), donc a appartient à A(b). 


b) Si b et b' sont deux éléments différents appartenant à F, alors l'intersection A(b)N A(b') 
ne contient aucun élément. 
Supposons en effet que b et b’ sont des éléments de F et qu’il existe au moins un 
élément x € A(b) N A(b') ; puisque x € A(b), on a f(x) = b et puisque x € A(b'), on 
a de même f(x) = b’; on en déduit b = b'. Par conséquent, si b Æ b’, il n’y a aucun 
élément dans l'intersection A(b) N A(b’). 


Certaines parties A(b) peuvent ne contenir aucun élément; si l’on supprime ces 
parties vides, on obtient une partition de l'ensemble FE, c'est-à-dire par définition, des 
parties non vides, deux à deux disjointes et dont la réunion est l’ensemble E. 


Définition 
Supposons que f est une application à valeurs réelles définie sur une partie de 
R? ou de R°. Pour tout nombre réel k, l’ensemble A(k) s'appelle la ligne ou la 
surface de niveau k de l'application f. 

Sur la carte topographique d’une pi 

région montagneuse, les lignes de b) 

niveau joignent les points qui sont 

à la même altitude : par exemple, O 

à proximité d’un col, les lignes de ee _… O “? 

niveau ont l'allure typique repré- |} 


sentée figure 4; les figures 1, 2 et 3 naure | figure 2 figure 3 figure 4 
montrent les coupes de terrain cor- 
respondantes. Sur une carte marine, les lignes de sonde sont les lignes de niveau pour 


la fonction profondeur. 
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Exemple 1. Pour tout (x,y) € R?, posons f(x, y) = 
x? +4y?. Pour cette fonction, la ligne de niveau k a pour 
équation x? +4y? = k. Si k <0, A(k) est l’ensemble vide. 
L'ensemble A(0) est réduit au point (0,0). Supposons 
k=7r?, où r >0, et notons C le cercle de centre (0,0) et de 
rayon r.On a les équivalences (x,y)E A(k)=—=x?+(2y)}= 
re (x,2y)eC. 

Notons M le point de coordonnées (x,y), M' le point de 
coordonnées (x,2y) et m le point de coordonnées (x,0). 
Comme M est le milieu de mM', on en déduit une cons- 
truction de la courbe A(k) : faire parcourir à M le cercle 


C' et prendre les milieux des segments mM', où m est y 

le projeté de M’ sur l’axe des abscisses. La courbe A(k) 

est une ellipse de centre O et d’axes Ox,Oy; on dit que > 
C' est son cercle directeur. Pour des valeurs différentes ” 
de k, ces ellipses sont disjointes et quand k parcourt 


[0,+oo[, la réunion des A(k) est le plan tout entier. des lignes de niveau de f 


construction de l'ellipse 
a? + 4y? = r? 


Exemple 2. La fonction f : R? —R définie par f(x,y) = x? —4y? a pour ligne de 
niveau k la courbe d'équation x? — 4? = k. Si k=—0, on obtient la réunion des deux 
droites d’équation x + 2y = 0 et x — 2y = 0, car x? — 4y? = (x + 2y)(x — 2y). 
Supposons k # 0 et choisissons un repère centré à l’origine © dont les axes OX et 
OY sont portés par les droites d’équation x + 2y = 0 et x — 2y = 0. L’équation de la 
ligne de niveau dans ce repère devient XY = c, où c est une constante qui dépend 
de k et de l’unité de longueur sur les axes : la courbe est donc une hyperbole 
d’asymptotes les axes OX et OY ; les branches sont situées dans des quarts de plans 
opposés qui dépendent du signe de k. 


Application bijective 


Définition 

On dit qu’une application f : E — F est bijective, ou que f est une bijection, si 
tout élément de F possède exactement un antécédent. Pour tout y € F, l'unique 
antécédent de y se note f-!(y). 


22 - LES FONCTIONS 


© Dunod -— La photocopie non autorisée est un délit. 


Les deux propriétés caractéristiques d’une bijection f : E — F' sont donc : 
isi æ et x’ sont des éléments de Æ tels que f(x) = f(x’), alors x = x’; 
ii tout élément de F s'écrit f(x) pour un certain élément x € E. 


Supposons que l'application f : E — F est bijective. À tout élément y € F, asso- 
cions l’unique antécédent de y : on définit ainsi une application de F vers E notée 
f':F—E. 


Définition 
Si f:E — Fest une bijection, l'application de F vers E qui à tout y € F° associe 
f-!(y) s'appelle la bijection réciproque de f et se note fl: F — EF. 


Si f est une bijection, alors par définition, 
pour tout y € F,on a f(f"(y)) = y, 
et puisque tout élément x € E est antécédent de f(x), on a 
pour tout re E, f "(iG) = ÿ. 

On en déduit que si f est une bijection, alors l'application f-! est bijective et la 
bijection réciproque de fl est f. 

Définition 

Si E est un ensemble, l'application identité de E est la transformation de Æ qui à 

tout x € E associe x lui-même. On note idg l'application identité de Æ. 
Par définition, si l’on compose une bijection f et sa bijection réciproque, on obtient 
l'identité ; précisément, si f : E — F' est une bijection, alors on a 


_ si 
Fo feidns po pl pie Pop eds, pr : 


EF 


Exemples 

1) La fonction sinus définit une bijection [—7/2,7/2] — [-—1,1] (exemples (2) et (3) page 
20). De même, pour tout nombre y € [—1,1], il existe un unique nombre x € [0,7] 
tel que cos x = y. La fonction cosinus définit donc une bijection [0,7] — [1,1]. 

2) La fonction exponentielle prend des valeurs strictement positives et définit une 
bijection exp : R — ]0,+c[. La bijection réciproque est par définition la fonction 
logarithme In :]0,+c[ — R, de sorte que l’on a In = exp! et exp = In !. 

3) Soient p un nombre réel et la fonction 
F:R—R définie par f(x)=x°+px. La 
dérivée est 3x? + p, donc f est stric- p>0 p=0 p <0 
tement croissante si p z 0; de plus, 
f(x) tend vers +o quand x tend Œ fs 
vers +00, vers —oo quand x tend 
vers —o et f est continue. On en 


YA y À YA 


8 Y 
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déduit que f est bijective si p > 0. 

Comme on ne sait pas résoudre en x l'équation 2°+px=Y, il n’y a pas de formule 

générale pour exprimer f7!(y). 

Dans le cas p < 0, la fonction est décroissante sur [/-p/3, —p/3] et croissante 

ailleurs, donc f n’est pas bijective. 

La pente de la tangente à l’origine est toujours p. 
4) Montrons que la fonction À :]0,+co[ — R définie par (x) = ie est bijec- 

tive. Nous devons vérifier que pour tout nombre réel y, y A 
l'équation 2 = y a exactement une solution x dans 
l'intervalle ]0,+oo[. L'équation s'écrit x? — 1 = yx ou en- 
core x? — yx — 1 —0, et les deux racines sont y + 4/y? + 4. 
Il y a une seule racine appartenant à l’ensemble de départ 
]0,+oœ[, c'est y + y? +4. Donc h est bien une bijec- 1 x 
tion et la bijection réciproque est définie par la formule 


Ru) = y+ Vy? +4, pour tout y ER. graphe de x + h(x) 


3.4 Changement de référentiel 
Soit f : E — E une transformation d’un ensemble E. Supposons qu’on dispose d’un 
ensemble E’ et d’une bijection u : E — E. 
Pour tout élément x € E, posons x’ = u(x). On a donc x = u l(x!). 
Si x et y sont des éléments de Æ, la relation y = f(x) définit entre les éléments 
x =u(x) et y = u(y) une relation de la forme y = f'(x!) : précisément, nous avons 
y = u(y) = u(f(x)) =uo f(x) =uo fu l(x)), pour tout x € E”. 


En posant f/=uo fou !:ÆF'— EF, on a ainsi l’équivalence 


y = f(x) y = f'(x). 


Définition 

Nous dirons que la bijection u : E — E" est un changement de référentiel ou un 
changement de coordonnées et que la transformation f/=uo fou !:E'— E' est 
transportée de f par le changement de référentiel u. 


Par un changement de référentiel convenable, la transformation f’ peut être plus 
simple à étudier que la transformation f. Voici des propriétés générales d’un chan- 
gement de référentiel. 
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Proposition. Soit xo € E. Posons x, = u(xo). 

i Les itérés x1 = f(xo),...,%x = f(æx-1),... de x0 par f ont pour image par u les 
ere die flat = fu). tes par À 

ü) L'élément xo est point fixe de f si et seulement si x, est point fixe de f' : autrement 
dit, les points fixes de f' sont les images par u des points fixes de f. 


Démonstration. Posons x, = u(x,) pour tout entier k > 0. Raisonnons par récurrence 
pour montrer que l’on a x, = f’(x,_,) pour tout entier k > 1. Puisque x1 = f(xo), il vient 
z, = u(x) = uo f(xo) = uo f(u-(xt)) = f'(x4). Supposons que k est un entier au moins 
égal à 1 tel que x}, = f'(x,_,). Puisque xy,1 = f(x), on a 24, = u(tr41) = uo f(x) = 
uo f(u-t(x,)) = f'(xx), d'où (. L'élément x9 est point fixe de f si et seulement si æ1 = x. 
Puisque u est une bijection, cette égalité équivaut à u(x:) = u(xo), c'est-à-dire à x! = x, et 
cette dernière relation signifie que x4 est point fixe de f’. = 


Exemple 1. Posons R' — ]0,+[ et considérons la transformation f : Ri — Ri 
définie par f(x) = ax”, où a est un nombre positif donné et r un nombre rationnel. 
Changeons de référentiel au moyen de la fonction logarithme In : R5 — R qui est 


bien une bijection. Pour tout x € R\, posons y = f(x), x =Inx et y = Iny. Il vient 


y=ax" et y =Iny=In(ar')=rmnxr+Ina=rx +Ina 


d’après les propriétés de la fonction logarithme (page 267). La fonction g qui à x’ 
associe y’ est donc simplement la fonction 2’ rx’ +b, où b=Ina. 


Dans la pratique, ce changement de référentiel s'utilise souvent dans les conditions 
suivantes : une série de mesures portant sur deux variables x et y semble indi- 
quer qu'il y a entre x et y une 
relation du type y = ax", mais ni 
r, ni a ne sont connus. On con- 
vertit les mesures æœ1,Y1, T2,Y2,... 
dans l'échelle logarithmique et l’on 
marque les points de coordonnées 
(nx1,Iny), (Inx2,ny),... Sup- 
posons que ces points soient à peu 
près alignés sur une droite; si r est la pente de la droite et si b est son ordonnée à 


mMP+InV =Ina 
PV =a 


TY 


nP 


l'origine, alors Inx et Iny sont liés par la relation Iny =rlnx+b, donc on a y=eltx". 
Exemple 2. Soient O un point du plan euclidien et so 
r la rotation de centre © et d'angle a. Pour tout point Le a Po 
m, posons M = r(m). 7 dd 
Soit D une droite et soient m', M", O' les symétriques de 0° 5 
m, M, O par rapport à D. Puisque l’angle de la rotation 

= Eu O!s. 

r est a,ona Om, OM = a et comme les angles Om,OM rs, 
et O'm',O'M' sont opposés, il vient O'm/,O'M' = —a. 7 a is 
Le point M' se déduit ainsi de m’ par la rotation r’ de V7 


centre O’ et d'angle —-a. 
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Notons s la symétrie orthogonale par rapport à D. Par le changement de référentiel 
s, la rotation r est transportée en la rotation 7”. 

On a m=—s(m/) et M=—r(m), donc il vient M'=s(M)=sor(m)=sor0os(m'). Puisque 
l'application m'-— M' est la rotation r”’, on en déduit l'égalité de fonctions soros=r". 


Dans le cas particulier où O € D, on a O = O' et donc r =r"!. 


Exemple 3. Donnons-nous des nombres réels a, b et p et définissons une trans- 
formation f : R? — R? en posant 
(1) f(e,y) =(x,y), où a'=ax et y =by+pz. 
Pour tout (x,y) € R?, posons u(r,y) = (X,Y), où 
(2) X=Z et Y=y+sr 
s étant un nombre réel que nous choisirons plus loin. Cela définit une application 
(z,y) + u(x,y) de R? dans R?. Puisqu’on a 
(3) m=X et y=Y-sr =Y-sX?, 
l'application u est bijective. Pour transformer f par le changement de référentiel u, 
nous devons exprimer (X”,Y’) = u(x',y) au moyen de (X,Y). D'après la définition 
de uw donnée en (2), on a 
X'=x et Y'=y +87. 

Exprimons x’ et y au moyen de x et y en utilisant (1) et (3) : 

X'=x =ax=aX , ca X =7x, 

Y' = by+ pr” + 57° = b(Y — sX°) + pX° + s(aX)° = bY + [p — s(b-a°)] X? 
Rappelons que nous avons le choix du nombre s : si l’on peut prendre s de manière 
à annuler le terme en X? dans l'expression de Y”, alors la relation entre (X,Y) et 
(X',Y”) sera très simple. 


pourvu que b £ a?, condition 


L'équation p — s(b—a?) = 0 a pour solution s = à 2 s 
—@ 

qui dépend de la fonction f. 

Supposons b 4 a?. Alors en choisissant pour s la valeur calculée ci-dessus, on obtient 


les relations linéaires 

(4) X'=axX et Y'=bY. 

qui expriment la transformation f dans les «nouvelles coordonnées » X et Y. Par 
le changement de référentiel u, f est transportée en f':(X,Y)1 (aX,bY) dont 
l'expression est plus simple que celle de f. On a l'égalité de fonctions f'=uo fou |. 
Il est significatif que les nombres a et b, coefficients de x et de y dans les expres- 


sions (1), se retrouvent comme coefficients de X et de Y dans (4) : l'explication 
sera donnée page 389. 
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3.5 Groupes de transformations 


Rappelons qu’une transformation d’un ensemble Æ est une application de Æ dans 
E. Les transformations bijectives sont particulièrement utiles. 


Exemples 

Dans l’espace euclidien, une symétrie par rapport à un plan ou une rotation autour 
d’une droite sont des transformations bijectives. 

Soit F' l’ensemble des fonctions de R dans KR et soit a un nombre réel. Pour toute 
fonction f :R—R, définissons la fonction f, : R —R en posant f,(x) = f(x + a) 
pour tout x € R. L'application f — f, est une transformation de F. Remarquons 
que si g= fa, alors g(x — a) = f(x) pour tout x, donc gç_,) = f : la transformation 
ff fa est donc bijective, la bijection réciproque étant gr g(_4). 


Mettons en évidence les propriétés générales des transformations bijectives d’un 
ensemble Æ. Rappelons que l’on note id£ l'application identité de E : c'est une 
transformation bijective de E. 

A) Pour toute transformation f de E, on a foidg =idgof = f. 

B)Si f est une transformation bijective de Æ, la transformation réciproque f ! 
permet «d’inverser» f : si x et y sont des éléments de Æ, on a l’équivalence 
ve fix) = f y). Pour tout se E, on a JF n))=zref ((J()=2, 
ce qui se traduit par les égalités entre transformations : 

fof"=f'of=ids. 

C)On peut toujours composer deux transformations de E. Si f et g sont des trans- 
formations bijectives de Æ, leur composée go f est une transformation bijective 
de E et la transformation réciproque de go f est f log! : pour tout x € E, on 
a en effet les égalités 


(f'og')o(gof)=f" o(g'ogjof=f"oidsof=f"of=idr. 


Proposition. Soient f, g, h des transformations bijectives d'un ensemble E. 
) Pour tout entier n > 1, la transformation réciproque de f" est (f") = (ft. 
ü) On a les équivalences : 

adf-g— foh=goh hof—=hog. 


bif=nés fo es fes 


Démonstration. La propriété (i] est vraie si n — 1. On a aussi f? = fo f et donc (f?) | — 
flo ft =(f-1)? d'après ce qui précède. La formule générale se démontre en raisonnant 
par récurrence. 

Si f = g, alors en composant à droite par la transformation h, on obtient fo h = go h. Réci- 
proquement, supposons f o h = go h. En composant à droite par la transformation h-!, nous 
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obtenons fohoh l=gohohl; puisque hoh !—idx, il vient foidx = goidp, c'est-à-dire 
f = g. On montre de même l'équivalence f=g—hof=hog, d'où (a). 

En choisissant h — g-!, on obtient f=g4 fog !=gog 4 fog-! —=idy. De même, 
avec h=f-l,onaf-g= flof-=f log idg = f-tog. = 


Notation. Soit f une transformation bijective d’un ensemble E. Si n est un entier 
positif, la transformation (f")-1=(f-1)" se note f-". On a défini ainsi f? pour 
tout entier p positif ou négatif. De plus, on pose f° = idx. 
Avec cette notation, on vérifie facilement la règle de calcul : 


fo ff = fP"4 quels que soient les entiers p € Z et q € Z. 


Définition 

Soit E un ensemble et soit T un ensemble de transformations bijectives de ÆE. On 

dit que T'est un groupe de transformations de E si l’on a les trois propriétés suivantes : 

i) la transformation idg appartient à T'; 

ü si f et g appartiennent à 7, la composée go f appartient à T'; 

ü) si f appartient à T', la transformation f ! appartient à T. La transformation 
f-! s'appelle aussi l'inverse de f. 


Soient T' un groupe de transformations et f € T°. Pour tout entier n > 1, f" appar- 
tient à T', donc la transformation (f") ! = f " appartient aussi à T. Puisque f! est 
la transformation identité, on a f0 € T. On en déduit que f? appartient à T' quel 
que soit l’entier p € Z. 

L'ensemble de toutes les transformations bijectives de Æ est un groupe de transfor- 
mations. Voici d’autres exemples. 


Exemple 1. Soit O un point du plan euclidien 4. L'ensemble des rotations de 
centre © est un groupe de transformations du plan. 
En effet, l'identité de est la rotation d’angle nul, la composée de deux rotations de 


centre © est une rotation de centre © et si r est la rotation de centre O et d’angle a, 
la transformation réciproque de r est la rotation de centre O et d’angle —@. 


Exemple 2. Soit f une transformation bijective d’un ensemble E. L'ensemble des 
transformations f”, où n parcourt Z, est un groupe de transformations; on dit que 
c'est le groupe engendré par f. 


Exemple 3. Soient O un point du plan euclidien et r la rotation de centre O 
et d'angle 1/3. Soit T le groupe engendré par 
r, c'est-à-dire que T' est l’ensemble des rotations 
r", où n € Z. Le tableau ci-contre indique l’angle r/3 | 27/3 7 47/3 | 5x/3 


T r? Tr r4 r° 


2 pd 


des rotations r,r°,r ,74 et r° : 
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Puisqu’on a 6(x/3) — 27, la rotation r° est d’angle nul, donc r6 — id». On en déduit 
Sor l=7r !, Plus généralement, si n est un entier 
de signe quelconque, on a r 5—7y", Le groupe engendré par r ne contient 
donc que les six rotations rË, où 0<k<5, de sorte qu'on a T'— fidg,r,r?,r3,r4,r5}. 


Voici le tableau des inverses des éléments de T° : 


+ . [4 
r'=ror=r, r8=7r? et aussi r°=7r 


n+6 r'or 


n € F 
f lidlr lr | r | rt | 7 


= . 5 L à 
f'lidlm | lr | 7r Tr 


= On a (r=rf=idg, donc (r2)743 = p2n+6 = 728 = (72) Dour tout entier n € Z; le 
groupe engendré par r? est donc seulement formé des trois rotations (r?)° = id», 
r? et (r?)? = r* ; les transformations r? et r{ sont inverses l’une de l’autre. 

Puisque (r°)? est l'identité, on en déduit de même que le groupe engendré par 
r% est l’ensemble à deux éléments {idy,r°}. La transformation r° est son propre 
inverse ; d’ailleurs, l’angle de la rotation r° étant égal à 7, r° est la symétrie par 


rapport au centre ©. 


c 2 < 2 
La figure de gauche montre les itérés par r } ? 
du point 1, numérotés de 2 à 6 : la rotation 
r les déplace circulairement. 4 14 1 
A 1121341516 
r(412/13/4)5)6 11 5 6 5 6 


Par la rotation r?, les points 1, 3, 5 sont déplacés circulairement et les points 2, 4, 6 aussi. 


ALES) A 1-6 A |11412151316 
(411315114162 r(4)1411151216]|3 


Exemple 4. Soit a un nombre réel. Pour tout nombre réel t, définissons la 
transformation f; de R? en posant 


fitx, y) = (ex,e"(y+tx)), pour tout (x.y) € R°. 


On a fo(x,y) = (x,y) pour tout (r,y), donc fs est la transformation identité de R?. 
Posons (X,Y) = fi(x,y), c'est-à-dire X = etx et Y — el{(y +tx). 
Si test un nombre réel, il vient Y +4'X = e"(y+tx) +teftx = ett{(y+(#+t)x) et 


(fu o fi)(x, y) = fr (X, Y) = (erax, era(Y + t'X)) 
_ CE elaeta (y + (+ Dx)) 
= (eee, ee (402) = fou(en). 


On a donc l'égalité fy 0 f; = fy4+4. Cela montre que la composée de deux trans- 
formations du type f; est du même type. En choisissant #’ = —t, il vient l'égalité 
fo fs= fo=idre : ainsi chaque transformation f, est une bijection et l’on a (f;) 1=f ;. 
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L'ensemble des transformations f;, où t parcourt R, est donc un groupe de trans- 
formations de R?. Remarquons que l’on a fo fi = fo fw, car t'+t—=t+t : on 
peut donc composer les transformations f,; dans l’ordre qu’on veut. 

Puisqu’on a toujours f,(0,0) — (0,0), le point (0,0) est laissé fixe par toutes les 
transformations f:. 

Soit (p,q) un point de R? différent de (0,0). Quand t varie, les points (x, y) = 
J:(p,q) = (peïs, (g+pt)et®) décrivent une courbe passant par (p,q), car (p,q)= fo(p,q). 
Supposons par exemple a > 0. Quand + tend vers —c, les deux coordonnées x; et 
y tendent vers 0, car lim el = lim te! —0( : cela veut dire que le point (xs, w) 


4——00 t——00 
tend vers l’origine quand t tend vers —co. Quand { tend vers +co, les valeurs 
absolues des coordonnées x, et y; tendent vers l'infini. 
Sur la figure ci-contre, nous avons représenté quelques-unes de ces courbes ; la flèche 
indique le sens de parcours quand +t augmente. Si l’on 


suppose que + est le temps, le point M — (x;,w) de AY 
la courbe a pour vitesse à l'instant { le vecteur _ — 
dx d)= (4 tay d «]) 
(2, di mn [pe**], _ [(a + ptje ] . Il vient donc 
z 
d 
(ue. u) = (ape, ae“*(q+ pt) + pe) = (ax, ay + x) 4 


Aïnsi le mouvement de M est régi par le système 
d'équations différentielles a 

Y = ay+x 
désignent comme d’habitude la dérivée par rapport au 


, où à et ÿ 


temps. Remarquons que le vecteur vitesse du point M] ne dépend que des coordonnées 
de M. Les équations différentielles de ce type seront traitées au chapitre 16. 


a Exercices mms 


. Un exemple de suite périodique. Pour tout entier n >1, notons r, le reste de la division 


euclidienne de 2” par 15. 
a) Calculer r1, ro, r3 et r4, puis montrer que l’on a rh}4 = Tr» pour tout n. 


b) En déduire la valeur de r,, quel que soit l’entier n > 1. 
Meilleure approximation de 4/2 par des fractions 
a) Montrer que la partie entière de 2 est égale à 1. 


1 l 
et 1+V2=2+ . 
1+V2 1+Vv2 


c) En déduire les quatre premières fractions de la meilleure approximation de V2. 


b) Montrer que l’on a V2=1+ 
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d) On dispose de deux pendules simples, constitués chacun d’une masse 
suspendue à l'extrémité d’un fil non pesant; pour de petites oscillations, 
la période est proportionnelle à la racine carrée de la longueur du fil. 
La longueur de l’un des pendules est double de l’autre. En position de 
départ, les pendules sont écartés de leur position d'équilibre d’un même 
petit angle, puis on les lâche au même instant. 
{il Montrer que les pendules ne reviendront jamais exactement dans la configuration 
de départ. 
li) On observe qu'après sept oscillations complètes du petit pendule, les deux 
pendules sont presque dans la position de départ. Expliquer pourquoi. 
li) Ces retours simultanés presque à la position de départ se reproduisent avec une 
précision croissante après n1,N2,N3,... Oscillations complètes du petit pendule. 
Calculer les entiers n1, n2 et n3. 


. ltération affine. Soient a et b des nombres réels et soit f : R — R la fonction définie 


par f(x) = ax + b. Donnons-nous un nombre x, et notons x, les itérés de x par 
: ils sont définis par la relation x,,1 — f(x,), pour tout entier n > 0. 
il t définis par la relati + pour tout enti > 0 


a) Montrer que si ja] < 1, la suite (x,) a pour limite le point fixe w de f. 


b) On suppose 10 £ w et |a| > 1. Montrer que le rapport x,/a” tend vers x — w 
quand n tend vers l'infini. En déduire que |x,| tend vers +oo. 


. On place un capital c à un taux d'intérêt à ; le montant de la prime versée annuellement 


est b. Posons r — 1 + et notons €, la somme disponible après n années. 
Montrer que l’on a Ch+1 = rCn + b. En déduire que c, = er" + (b/i)(r" —1). 


Un modèle d'offre et de demande. Dans certains secteurs économiques (comme l’agri- 
culture), le prix p des biens pendant une période est fonction de la quantité q de 
biens consommés et la production Q pendant cette période est fonction du prix p 
pratiqué pendant la période précédente. Supposons qu’en utilisant des unités con- 
venables, ces fonctions sont assez bien représentées par les formules p — 80 — (1/2)q 
et Q = (1/3)p +20 (remarquer que p est fonction décroissante de q et que Q est 
fonction croissante de p'). Supposons aussi que l'équilibre q = Q est réalisé. Notons 
Pn et an le prix et la consommation pendant la n-ième période. 
a) Montrer qu’on a la relation py11 — 70 — (1/6)p,. En déduire l'égalité ph — 
(20 — g0/2)(—-1/6)" + 60. Vers quelle limite tendent les prix ? 
b) On suppose qo = 20. Pour visualiser l’évolution des prix, dessiner, dans un re- 
père du plan, les points de coordonnées (n,p.), pour 0 < n < 6. Observer que la 
fluctuation s'amortit. 


. Soient p un nombre réel et f:R—R la fonction définie par f(x) =x°—pæ, où p > 0. 


a) Étudier les variations de f et dessiner le graphe. 


b) Si b est un nombre réel, déterminer le nombre d’antécédents de b par f (discuter 
selon les valeurs b et de p). 
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@ 7. a) Montrer que les fonctions {+ {—sint et {+ {— cost sont des biïjections strictement 
croissantes de R dans R (utiliser la dérivée). 


b) Supposons que deux quantités réelles x et y sont reliées par la relation 
æ+y—=sinx+cosy. Montrer que y est fonction strictement décroissante de 
x. En déduire que l'équation 2x — sin x + cos x a au plus une solution. 


c) Montrer que l'équation 2x —sinx+cosx a exactement une solution, comprise entre 
x/6 et x/4 (étudier la fonction 27—sinx—cosx sur l’ensemble R : elle est croissante). 


@ 8. Des lignes de niveau sonore. Sur un terrain plan, on pose des amplificateurs a1 et 
a) en des points A; et A2 distants de 20m. Pour chacun de ces amplificateurs, 
l'intensité sonore reçue en un point est inversement proportionnelle au carré de la 
distance à l’amplificateur. 

Quelle est la courbe formée des points où l'intensité reçue de a; est k fois l’inten- 
sité reçue de a, k étant un nombre positif donné? Comment évolue cette courbe 
lorsque k devient grand ? 


Choisir un repère orthonormé d’origine le milieu de (A1, 42), avec l'axe des x porté 
par la droite A; 42. Si k Z 1, l'équation trouvée est de la forme 2? + y? — Qux + v = 0 
et la courbe est un cercle centré en un point de la droite A; A, ; si k = 1, la solution 
est la médiatrice de (A;, 4). 


9. Pour chacune des fonctions f : IR? — R suivantes, représenter sur un même dessin 
les lignes de niveau indiquées : 


a) f(x, y) = x°y°, niveaux 0, 1 et 4 b) f(x, y) = |x[+|yl, niveaux 0, 1 et 2 
d f(x,y) = |y—1l+x, niveaux —1, 0, 1 d) f(x,y) —|y-1|+2?, niveaux 0, 1, 2 


@ 10. Utilisation d'un changement de référentiel 
2 
Pour tout x > 0, = T1 et f(x) = 1, 
our tout x > 0, posons u(x) Lee f(x) ee 


a) Montrer que la fonction w est une bijection de [0,+co[ sur [0,11. 


b) Montrer que f est une transformation de l'intervalle [0, +co|. 

c) Soit g : [0,1] — [0,1[ la fonction transportée de f par le changement de référentiel 
u. Montrer que l’on a g(x') = x"? pour tout x’ € [0,1[. 

d) Quelle est la limite des itérés par g d’un nombre x € [0,1]? Quelle est la limite 
des itérés par f d’un nombre x9 > 0? 

e) Montrer que f est une transformation bijective de l'intervalle [0,+co[. Quelle est 
la limite des itérés de x9 par f !? 


11. Effet « zoom ». On a fait dessiner, par un ordinateur, le graphe d’une fonction f sur 
l'intervalle [—a,a] (où a > 0). Cette fonction est telle que f(0) — 0. On veut faire 
subir au dessin un effet «zoom » d’un facteur k > 1 en centrant l'opération sur l’ori- 
gine. Cela revient à changer de référentiel au moyen de la bijection x kx. Quelle 
fonction doit-on demander à l'ordinateur de dessiner pour obtenir le résultat ? 
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12. 


Reprenons l'exemple 4 page 29 dans le cas a — 1. Étant donné un point (x0, Yo), 

nous avons dessiné (pour a = 1) la courbe C décrite par les points de coordonnées 

Le = exo, Y+t = e! (yo +txo) quand t varie. On se propose, dans cet exercice, de 

justifier l’allure de la courbe. Pour simplifier, supposons x0 — 1. 

a) Montrer qu’un point (x,y) est sur la courbe C' si et seulement si l’on a x > 0 et 
U = Yor + xinx. 

b} Étudier la fonction x + yyx + xinx. Représenter sur un même dessin le graphe 
de cette fonction pour les valeurs yo = 0, Yo = 1, Yo — —1. 


. Un groupe de transformations géométriques. Soit 4 le plan euclidien muni d’un repère 


orthonormé (O;i,j). On note t la translation de vecteur à et s la symétrie par 

rapport à l’axe des ordonnées. Si a € R, notons D, la droite parallèle à l’axe des 

ordonnées et passant par le point (a, 0). 

a) Pour tout point M de coordonnées (x,y), calculer les coordonnées des points 
t(M) et s(M). 

b) Montrer que s0 s est l'identité, que to s est la symétrie par rapport à la droite 
Di et que {0 s est la symétrie par rapport à la droite Di. 

€) Montrer que l’on a sot=t los. 

d) En déduire les relations sot?—t Pos pour tout entier pe Z et (sotP)o(sot1)—#17P 
pour tous entiers p et q. 

e) En déduire que l’ensemble T = {#? |pe Z}U{sot? |peZ} est un groupe de 
transformations du plan. Vérifier que T' contient les symétries par rapport aux 
droites D, et D,,:, quel que soit l’entier p € Z. 


le groupe T' génère une frise 
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Chapitre 2 


Nombres complexes 
et polynômes 


1. Les nombres complexes 


Ajoutons à l’ensemble des nombres réels un symbole 2 et étendons à cet ensemble les 
opérations somme et produit : on forme ainsi les expressions ro+riè+roë? ++, 
où les coefficients r; sont des nombres réels. La somme et le produit de deux telles 
expressions est de la même forme. 
Convenons que le symbole à vérifie la relation à? = —1. 

L'ensemble des expressions ro +ri+rat RENTE rp1? , muni de la somme et du 
produit, se note C et s'appelle l’ensemble des nombres complexes. La relation à? = —1 
permet de simplifier l'expression d’un nombre complexe : on a 4% —(à?)ài = —4 et 
i=(—1)?=1, donc par exemple 1—2i+31%+435—1-—25+3(—41)+4i=1—54. Plus gé- 


néralement, pour tout entier n>0, on a &—(3?)"=(—1)" et 427112 (32)3=(—1)"3. 


Il s'ensuit que tout élément de € s'écrit a + bi, avec a et b des nombres réels. 


1.1 Règles de calcul sur les nombres complexes 
Voici les règles concernant les expressions a + bi, où a et b sont des nombres réels. 
(a+bi)+(a +b'i)=(a+a)+(b+0b')i et (a+bi)(a +b'i) = (aa! —bb')+(ab'+ba/)i. 
ü) On a l'équivalence a + bi =0 — (a =0 et b = 0). 


Démontrons le sens direct de (ï]. Supposons que a et b sont des nombres réels tels que 


a+bi=0, ou encore a = —bi. En élevant au carré, on obtient a? =(—bi)? =b?à2 = -1?, 


2 


Mais puisque a et b sont des nombres réels, a? est positif ou nul et —b? est négatif ou 


nul, donc a=b=0. 
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Définitions 

Soit z = a + bi un nombre complexe, où a et b sont des nombres réels. 

— Le nombre a, appelé partie réelle de z, se note Ze(z); le nombre b, appelé 
partie imaginaire de z, se note «Zm(2). 


Le conjugué de z est le nombre complexe Z — a — bi. Le module de z est le 
nombre réel positif ou nul |2| = Va? + b?. 


On a les relations: 2%e(z)=2+27, 2i9m(z)=2-—-2Z, |2] 
les équivalences : (|=0—2:=0) , (2E€R—z:=Zz) 


et les inégalités : Re(z)| < |2| et | Zne(z)| < |2. 


Pour montrer ces inégalités, il suffit de remarquer que si z = a + bi, alors a < a +? 


donc |a| < Va? +b?, et de même |b| < Va? + b2. 


Si z est un nombre réel, le module de z est simplement la valeur absolue. 


Inverse d'un nombre complexe non nul. Si z est un nombre complexe non 
nul, le module de z est un nombre réel non nul; en divisant par |2/? l'égalité 


22 = |2|?, on obtient 4 L E À — 1 : cela signifie que le nombre complexe REF? est 
74 


l'inverse de 2 pour la multiplication. 


Si z2—a+bi est un nombre complexe non nul, l'inverse de z pour la multi- 


lication est Le nombre complexe 27! = hu, = d b î 
P P 2 LP &+P æ&+b 


Calculs sur le conjugué et le module. Pour tous nombres complexes z et z!, on a 
P 


Pr Bots Pr per ! 
z+z'=25+2z ,22 —=252z etsi z£0, (£) = 


_ 1 


ar [Xl] 


z! 
Z 


nas |=|x|l#| ét si 4240, 


ER 

ïü) |z + 2/| <|2| +121 (Gnégalité triangulaire) 

Démonstration 

i Si z—a+bi et z/—a+b'à, alors 2+2/—=a+a-bi-bli=2+27 et 22 —(a—bi)(a —b'i) — 
(aa/—bb') — (ab'+ba’)i = 22. Pour la troisième égalité, il suffit de montrer que pour z £ 0, 


: 2 Le 1 se 1 a b 
Il de — est =, lte de la fl Il : 
e conjugué de . es - ce qui résulte de la formule Rte up jun À 


12222, il vient 


ii) Puisque |2/? = 2z et |z 


(DE = IAE = 2227 2 (22122) = (G2)7) = 127 
z 0, alors on a 1= fi] = |e , done | 1) = LL. 
zl al 
ii) On a 


le+2' 7 = (2+2)(G+42) = 23422 + 23422 
= 27 +2%e(z7) +17, carz7 =27. 
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Par suite, 


12 + 21 


la? +2 


27 + 221121 + [2 car 


Re(zz)|+|7|? car pour tout nombre réel x, on a x < |x| 
Re(zz')| < |Zz'| = 


/ 


A 


< 
< 


A 


z'|=|z 


112 

< (l1+121)7. 
Puisque le module est un nombre réel positif ou nul, on en déduit l'inégalité triangulaire 
en prenant les racines carrées. = 


Exemple. Supposons qu’un nombre complexe z vérifie l'inégalité |z— a| < a, où a 
est un nombre réel strictement positif. Puisque %e(a) = a, on a alors | e(z) — a| — 
Re(z— a)| £|z— al <a, ou encore —a < Re(z) — a < à : cela implique He(z) > 0. 


Argument d'un nombre complexe. Rappelons la propriété suivante : 


si a et b sont des nombres réels tels que a? + b? — 1, il existe 
un unique nombre réel t € [0,27{ tel que a = cost et b=sint. 


Puisqu'un nombre complexe de module 1 s'écrit a+ bi, où a et b sont des nombres 
réels vérifiant a? + b? — 1, on en déduit que tout nombre complexe de module 1 est 
de la forme cost +isint. 

Si z est un nombre complexe non nul, le nombre Z_ est de module 1, donc s'écrit 


Z = cost +isint, où t € [0,2r|. 4 


ll 
Définition 
Tout nombre complexe z 0 s'écrit de manière unique z = |z|(cost +isint), où 
te [0,2r[. Le nombre t s'appelle l'argument de z et se note Arg(z). 


Des nombres complexes non nuls sont égaux si et seulement s'ils ont même module 
et même argument. 

Soit z un nombre complexe non nul. Le nombre z est réel positif si et seulement 
si Arg(z) — 0. Le nombre z est réel négatif si et seulement si Arg(z) = x. 


Formules de Moivre. Pour tous nombres réels t et t’, on a 
i) (cost + isint) (cost + isint’) = cos(t + +”) + ésin(t + #/). 
sé. —1 és 

ii) (cost + isint) = Cost — 2sint. 

iii) (cos t+isin t)" = cos nt +1sinnt, pour tout entier n € Z. 

Démonstration. La première égalité est une transcription des formules de trigonométrie 
cos(t ++) = costcost’ —sintsint’ et sin(t +) =sintcost{’ +costsint’. Le nombre cost +isint 
étant de module 1, son inverse est égal à son conjugué cost — isint. La troisième formule se 


démontre par récurrence pour n > 1 en utilisant (i}; on en déduit la formule pour n < 0 en 
appliquant (ii) et les relations cos(—nt) = cos(nt) et sin(—nt) = —sin(nt). = 


Pour pratiquer la dernière formule de Moivre, on utilise le développement de (a+b)" 
par la formule du binôme de Newton (page 61). 
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Argument d'un produit ou d'un quotient. Si des nombres complexes non nuls 
z et 2! ont pour argument t et t', alors 


— le produit 22! a pour argument t ++ modulo 27, 
le quotient " a pour argument t —t modulo 27. 


1.2 Exponentielle d'un nombre complexe 


Pour tout nombre réel x, on sait définir l’'exponentielle de x, notée exp x ou encore 
7 ! 5 
et. Ona e=1,e" >0 et ee” = e***® pour tous nombres réels x, x’. 


Définition 
Si z = x +y1 est un nombre complexe, où x et y sont réels, le nombre complexe 
exp 2 = (exp x)(cos y + isin y) s'appelle l’exponentielle de z ; on le note aussi e*. 


Cette notation est justifiée, car si z est un nombre réel x, alors sa partie imaginaire 
y est nulle, on a cosy + isiny — 1 et exp z est égal à l’exponentielle réelle de x. 
D'après la définition, on a pour tous nombres réels x et y, les relations 


= cosy+isiny , et — er eiv 
. 1 . nn : . 1 . 2 à 
cosy = He(et) — ne +eT#Y) , siny = Smet) = rl —e7*%) 
2 
> eiT/2 = j | er =] . e2iT =], 
m EUVTT) = eiv eilyt2r) = eiv 


Exemples. On a 1+4i— VaeiT/A, V3+i-2eiT/6 et 14343 = 2eiT/3. 


Propriétés de l'exponentielle 
1) Pour tous nombres complexes x et z', on a ete? = et? 


2) Pour tout nombre complexe z, on a e°=e? , [e*|=e%*() et Arg(e°)—Zm(z) modulo 27. 


14 : / # % 
3) Pour tous nombres complexes z et z!, on a l'équivalence e* =e* = z/=2+2kri, où keZ. 


Démonstration 
1) En posant z=x+iy et 2 = x +iy", où x,y,x’,y' sont réels, il vient 
€ 
Z ,Z 


ee” = (expæ)(cosy + isiny)(expæ’)(cos y’ + isiny') 


= (expæ)(exp x’ )(cos y + ésiny)(cos y’ +ésiny’) 


= exp(x + x’) [cos(y + y’) + ésin(y + y')] = ete. d’après la formule de Moivre. 
2) Posons 2 = x +iy, où x = Be(z) et y = Pm(z). On a l'égalité 


eËY = cosy +isiny = cosy—isiny=e ‘Ÿ 


Z 


et puisque e* = e°e*Ÿ, il vient e7 = efeiv = eeiy —eve rt eve 


On a aussi [ef] = |cosy+isiny| = 1, donc [e*| =[e*eiv| = |e|leiv| =e?, car e* est positif. 
Par définition, Arg(e*) = Arg(e) est égal à y modulo 2r. 

3) Supposons que u est un nombre complexe tel que e“ = 1 et posons u = a + bi, où a et b 
sont des nombres réels. On a 1 = [e“| =e*, donc a = 0 car la fonction exponentielle réelle 
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est une bijection de R dans ]0,+00[. On a aussi Arg(1) = 0 et Arg(e“) = b modulo 27, 


donc b est de la forme 2kr, où k € Z. Il s'ensuit u = bi — 2kri. Réciproquement, pour tout 
2kri 


entier k,onae = cos(2kr) + isin(2kr) = 1. Cela montre que les nombres complexes 


u tels que e“ — 1 sont ceux de la forme 2kri, où k est un entier relatif. 
Soient maintenant des nombres complexes z et 2’. D’après (il, on a l’équivalence = 


me" t=e-1. D'après ce qui précède, cela équivaut à z/—z=2kri, où ke Z. m 


. . : ; D 
Proposition. Si x et y sont des nombres réels, alors |e** — e*?| — 2] sin À 
Démonstration. Nous avons ef®—eîv—eiv{eil®—u) 1) donc [ef —eiv|={eiv|leitæ—u) 1] 
[eitt—w) — 1| car efŸ est de module 1. Posons 0 = x — y. Par définition du module, il vient 

jet® 112 2 (ei9 — 1)(20— 7) = (68 — 1)(e-59 1) 
ete 50 (0 +e-i8) +] 


= 1—-2Re(et°)+1—2-—20cos0. 


Puisque 1 — cos 0 = 2sin? £, on obtient |e*° — 1[? = 4sin? ê, d’où le résultat en prenant les 


racines carrées. = 


1.3 Utilisation géométrique des nombres complexes 


Donnons-nous un repère orthonormé (O:i, j) du plan euclidien. 

Si z est un nombre complexe, le point de coordonnées (a,b) s'appelle le point d’afixe 
z (dans le repère). Le nombre z peut donc se représenter par un point du plan. 

Si P' est le point de coordonnées (a/,b'), l’affixe de P' est le nombre z' = a +b'i 


et le vecteur PP est représenté par le nombre complexe 2! — z=— (a —a)+(b —b)i. 


Distance. La distance PP’ est égale à 4/(a! — a)? + (b — b)?=|2/—2|. En particulier, 
la distance OP est égale au module de z. 


Angle polaire. Soit P un point du plan différent de 
l'origine. Si z est l’affixe de P, les coordonnées de P sont 
(Izlcost,|z|sint), où t— Argz. Soit U le point de coordon- 


pu 


nées (cost,sint). L'angle de vecteurs i, OÙ a pour mesure 


t. On a OP=|2|OU et |z|>0, donc à, OP=i, OÙ. L'angle 


i,OP s'appelle l'angle polaire de P. L’angle polaire d’un 
point d’affixe z £ 0 a donc pour mesure Arg z. 


Coordonnées polaires. Puisqu’un nombre complexe non nul est déterminé par 
son module et son argument, tout point M du plan, différent de l’origine, est déter- 


miné par la distance OM et l'angle polaire i, OM. Soit dE [0,2x[ la mesure de l’angle 
polaire et soit r OM : les nombres r,0 s'appellent les coordonnées polaires du point M. 
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Angle de vecteurs. Soient A, P,Q des points du plan tels que P £ À et Q Z A. 


Les vecteurs non nuls AP et AQ forment l'angle AP, AQ = (40) — (Gr). 
Notons p l’affixe du point P et q l’affixe du point Q. Comme le vecteur AP est 
représenté par le nombre complexe p — a, l'angle ä, AP a pour mesure l'argument 


de p— a; de même, l’angle à, AQ a pour mesure l'argument de q — a. Donc l'angle 


AP, AQ a pour mesure Arg(q — a) — Arg(p — a) = Arg (: 2). 
pa 


0 T 
La figure de droite montre l'aspect géométrique de l'égalité |ei(v+0) — eiv| = 2}sin SL, 


pour y et Ô réels. 


Produit scalaire. Si U—ai-+bj et U'=ai+b j sont des vecteurs du plan, leur pro- 
duit scalaire U -U” est le nombre aa! +bb'. On a (a + bä)(a/+b'i)=(a—bi)(a+b'i)= 
aa + bb! + (ab! — ba')i, donc 


U:U' = Re(zz/), où z représente le vecteur UÜ et z/ le vecteur U’. 


Exemples de transformations du plan 
Les glissements. Étudions la transformation f : C — C définie par f(2) = z2+u, 
où uw est un nombre réel non nul. 
Si M est un point d’affixe z2=x+4y4, avec x et y des nombres réels, le point M" d’af- 
fixe Z=x—yi est symétrique de M par rapport à l'axe des abscisses. Soit M7” le point 
d’affixe f(z)=Z+u. Le vecteur M'M" a pour affixe f(z)—Z=u et puisque u est réel, 
on a M'M"=ui. La transformation du plan définie par M M" est donc la compo- 
sée tos de la translation + de vecteur ui et de la symétrie orthogonale s par rapport 
à l’axe Ox des abscisses : une telle transformation s'appelle un glissement d'axe Ox. 
On a 

foft)=fG+u)=Z7+Tutu 


=z+ü+u—=z+2u, car u est réel. 
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Le point d’affixe fo f(z) se déduit donc du point d’affixe z par la translation de 
vecteur 2ui. 


| : e, 


EE 
AE 


figure 1 figure 2 


La figure 1 montre quelques itérés par le glissement f. Les glissements permettent 
de réaliser des frises, comme on le voit sur la figure 2 et dans l'exercice 13 page 33. 


Les similitudes. Soient a un nombre complexe non nul, b un nombre complexe 

et f:C—C la fonction définie par f(2) = az + b. 

Soit z un nombre complexe ; notons M le point d’affixe z et M’ le point d’affixe f(2). 

-Sia—=1l,ona f(z)—2—b, donc MM'= OB, où B est le point d’affixe b. Le 
vecteur MM est fixe, donc la transformation du plan M M' est la translation 
de vecteur OB. Si b Z 0, il n’y a aucun point fixe; si b = 0, alors M’ = M et la 
transformation est l'identité du plan. 

Supposons a £ 1. Un nombre z est point fixe de f si et seulement si az +b=—2, 
ce qui équivaut à (1 — a)z — b. L’unique point fixe de f est donc w — b/(1 — a). 
En faisant avec des nombres complexes les mêmes calculs que dans l'exemple 2 
page lé, on obtient l'égalité 
(x) f(z) —w = a(z —w), pour tout ze C. " 

Notons {? le point d’affixe w. La distance (M est M' QM' = ja\QM 
égale à [z—w|, de même OM’ —|f(z) — w|. D'après a = Arg(a) 

(+), on a |f(z) — w| = |a(z — w)| = |al[z — w|, donc M 

QM' = |a|QM. 


—— 


Q 


L’angle de vecteurs OM,QM' a pour mesure 


Arg (=) = Arg(a). 


Cela signifie que M’ est l’image de M par la simili- R 
tude de centre (, de rapport |a| et d'angle Arg(a). “ 
Remarquons que si a est un nombre réel, f est une Q 


homothétie de rapport a. Si a n’est pas réel et si 
la] = 1, alors f est une rotation de centre (. 
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Itération par une similitude. Exprimons les itérés z1=az0+d , 22=az1+0 ,..., 2n=— 
@Zn_1 +b d'un nombre 29. D’après (+), on a 21 —w = a(zp —w), 22 —w = a(z1 —w) 
et en général z, — w = a(2n_1 — w). On en déduit 


Zn — w = &"(20 —w) pour tout entier n > 1, 


et comme w = ee il vient 2, = a"20 + w(1 — a") = a" 29 + pb 2 
— — & 


Exemple. La figure ci-contre montre les itérés du point Mo d'affixe 1 par la 


similitude z+ 2 +? _ gs : ; le centre est le point d’affixe 
1% 1 1-4 2 ; M | M 
= = =1+32,  * M 
Fo D nb Des 0 
; M5 
le rapport est | AE et l'angle est 
2 2 (a M; 
…: 2e ; el ==: 
a = Ârg ( à ) Arg(1+(i/2)). è | M, 
Puisque la partie réelle et la partie imaginaire de 1+ (4/2) à 
Mo M 


sont positives, on a 0 <a<r/2; la tangente d’un argument 
est le rapport partie imaginaire sur partie réelle, donc tg(a) = 1/2, ce qui donne 
pour « environ 26,565 degrés. 


Le groupe des similitudes 

Si a est un nombre complexe non nul et si b est un nombre complexe quelconque, 
notons fab : C — C l'application définie par faw(z) = az + b. Pour tous nombres 
complexes z et z/, on a l’équivalence 


(+) z = az+b 2 = 2 
a a 


donc l'application f,4 est une transformation bijective de l’ensemble C. 

Soit T°’ l’ensemble des applications f,+, où a Z 0. 

Nous allons montrer que l’ensemble Test un groupe de transformations de C. Pour 

cela, vérifions les trois propriétés de la définition donnée page 28. 

— On a f1o(z) = 2 quel que soit z, donc fi0 = idc : la transformation idc appartient 
donc à T. 

Composons les transformations Tab et Fed; où a et c sont non nuls : pour tout 
nombre complexe 2, il vient 


(fab © fea)(2) = fab(cz + d) = a(cz + d) +b = (ac)z + ad +b. 


Puisque ac n’est pas nul, la composée f, 20 fc,a = fac,ad+v appartient à 17°. 
1 
(0 
Ji/a,-v/a(7’), donc on a fn = fiya,-v/a. Cela montre que la transformation Le 


— D’après l’équivalence (+), la transformation réciproque de fa est 2! = 2! — = = 


b 
a 
appartient aussi à T. 
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L'ensemble T' est donc un groupe de transformations de C. Nous avons montré 
précédemment que les transformations du plan euclidien représentées par les appli- 
cations f4v sont les similitudes. L'ensemble des similitudes du plan euclidien est 
donc aussi un groupe de transformations. 


2. Fonctions polynômes 
2.1 Définitions et propriétés générales 


Définitions 

Un polynôme est une expression P =» +piz+p22?+...+ph2", où Do,P1,...Pn SONt 
des nombres réels ou complexes. Les nombres p; sont les coefficients de P. Si le coef- 
ficient p, n’est pas nul, l’entier n s'appelle le degré de P et se note degP. La fonction 
P:C—C définie par P(2)=po+p12+p22? +. ::+p,2" est appelée fonction polynôme. 


— La valeur P(0) = ps est le terme constant du polynôme. 

Une somme, un produit ou une composée de polynômes est un polynôme. 

Le produit d’un polynôme de degré p et d’un polynôme de degré q est un 
polynôme de degré p + q. Le polynôme nul n’a pas de degré. 

Il s'ensuit qu’un produit de polynômes n’est nul que si l’un des facteurs est nul. 

> On peut aussi dériver un polynôme, en appliquant les règles valables pour une 
fonction d’une variable réelle. Ainsi, la dérivée du polynôme 2F est kzK-1, où l’on 
convient (pour k=1) que l’on a 29 = 1. Nous ferons toujours cette convention 
dans les calculs. 


Définition 
La dérivé du polynôme P = po + p12 + p22? ++: + Paz 
pi +2p22 +: +npn2 sin>1.Si n—0, le polynôme P est constant et l’on a P'—0. 


"est le polynôme P' = 


On définit de proche en proche les dérivées successives de P : la dérivée seconde 
notée P” et pour tout entier k > 3, la dérivée k-ième, notée PK), 


Exemples 


> Si P = 7", la dérivée k-ième de P est 


pp) = PDO mnt S0<k<Nn 
0 | si k>n 
- Supposons P=po+p12+p22? +p32%. On a po = P(0) et P'=p1+2p2z+3p32?, donc 
p1 = P'(0). En dérivant à nouveau, il vient P" = 2p2 +3 x 2p3z, donc 2p2 = P"(0), 
puis P6) = 3 x 2p3, donc 6p3 = P6)(0). 
Plus généralement, pour un polynôme P = po +p12+-:-+p,2" de degré n, on a 
les relations k!pz — P&)(0) pour tout entier k tel que 0 <k< n. Les coefficients de 
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PA) 
P s'expriment donc au moyen des dérivées en 0 par les formules : px — _— 
On a ainsi l'égalité | 
P'(0 P"(0 


FO, 2 K! nl 


Formule de Taylor pour les polynômes. Si P est un polynôme de degré n, alors 
pour tout nombre complexe a, on a 

P'(a) P”(a) P@®(a) 

1! 2! k! 

Démonstration. Nous venons de voir que la formule est vraie si a — 0. Dans le cas géné- 
ral, définissons un polynôme Q en posant Q(z2) = P(2+ a). D'après les règles de dérivation, 
on a Q'(z) = P'(2+ a), d'où QW) (2) = PW)(2+ a) pour tout entier k > 1. On en déduit 
Q(0) = P(a), QM(0) = P)(a) et il vient 


(n) 
P=P(a)+ (2—a)?+...+ Ga +. +270 (2 


(2—a)+ 


!(0 (0 &)(0 (n) (0 
1! 2! k! n! 
Foi Ps 200, Fd, 
Be UE DORE Ne 
Remplaçons z par z — a; puisque Q(z — a) = P(z), on obtient la formule annoncée. î 


2.2 Racines d'un polynôme 


Définition 
Soit P un polynôme. Un nombre complexe a tel que P(a) —0 s'appelle une racine 
de P. Si P(a) = P'(a) = 0, on dit que a est racine multiple de P. 


Exemples 
Les nombres à et — à sont racines du polynôme 2? +1. 
= Posons j= 1 + Vi. Ona = 1 VS = j, d'où j+ÿ=j+7=2%e(j) = -1. 


Il vient donc la relation 1 + j + j? 0. Cela signifie que j est racine du polynôme 
2? + 2+1; l’autre racine est 7, car 1+7+7=1+5j+32 =1+(—-1) = 0. 


Proposition. Soit P un polynôme à coefficients réels. 


Pour tout nombre complexe 2, on a P(z) = P(2). 
Si a est racine de P, alors & est racine de P. 


Démonstration. Soit P = po +p1z+--:+p,2" un polynôme dont les coefficients Po,...,Pn 
sont tous réels. On a 


P(2) = po + p1z +++ + part = Po + pis + +pnzt 
= po +piit+e+par car pri = ÿiéi et Pi = p; 
= Po+pi?+--+pn?" car 2 = 2!. 
= P(2) 
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Si a est racine de P, alors on a P(a) = 0, donc aussi P(a) = 0 et par suite P(a) = 0. ü 


Proposition. Soit P un polynôme. 

— Un nombre a est racine de P si et seulement s'il existe un polynôme Q tel que P=(:-a)Q. 

Un nombre a est racine multiple de P si et seulement s'il existe un polynôme R tel que 
P=(s-@)n 


Démonstration. Si Q existe, alors P(a) — (a — a)Q{(a) —0, donc a est racine de P. Réci- 
proquement, supposons P(a) = 0. D'après la formule de Taylor, nous avons 


"(a M) (a 
P = P(a) + P{a)(z — a) + La ap ++ EX day 
“(a M) (a 
= (z-— a) P'(a) + 1 La a+ + A ) Ge _ ayr=1 


expression qui est bien de la forme (z— a)Q, où Q est un polynôme. 

Supposons que P=(z:-—a)?R, où R est un polynôme. En dérivant, on obtient P’ — 
2(z2—-a)R+(z-— a)?R', donc P'(a) = 0. Réciproquement, supposons P(a) = P'(a) — 0. Alors 
P" (a) 


! 
l'expression de P. - = 


le premier terme de la formule de Taylor est (z— a)? et (2 — a)? est en facteur dans 


Exemple. Posons P=2?—32+a, où a est un nombre réel. Les racines de P/=32?-3 


sont +1 et l’on a P(1)=-2+4a, P(-1) =2+a : le polynôme P n’a donc une 


racine multiple que si a = +2. 
Pour étudier les racines de P, nous avons représenté ci-dessous les graphes des 
fonctions x + x° — 3x + a lorsque a prend les valeurs 0, 1, 2 et 3. 


yÂ 


y= 2° 3x y= 2 3x+1 y= 2° 3x +2 y= 2° 3x +3 
figure 1 figure 2 figure 3 figure 4 

- Si a€]-2,2[ on voit que le graphe de la fonction x + x° — 3x + a coupe l’axe des 
abscisses en trois points : le polynôme P a donc trois racines réelles (figures 1 et 
2). En ces points, le graphe n’est pas tangent à l'axe des abscisses, ce qui traduit 
le fait que les racines sont simples, c’est-à-dire non multiples. 

— Si a = 2, le graphe est tangent à l’axe au point d’abscisse 1 : cela correspond aux 
égalités P(1) = P'(1)=0, donc 1 est racine double de P (figure 3). La factorisation 


CHAPITRE 2 - NOMBRES COMPLEXES ET POLYNÔMES - 45 


P=2#-3z+2—(2-1)(2+2) montre que l’autre racine est —2. De même, si 
a = —2, alors P(—1) = P'(—1) = 0 et —1 est racine double de P. 

— Supposons a > 2. La fonction x + P(x) ne coupe l’axe des abscisses qu’en un seul 
point æa < —2 : le polynôme P n’a qu’une racine réelle (figure 4). On a une factori- 
sation P=(2-x,)(2?+pz+0), où p et q sont réels car P est à coefficients réels. Les 
autres racines de P sont donc celles du trinôme 2? +pz+q : celles-ci sont nécessaire- 
ment non réelles et conjuguées l’une de l’autre. Les trois racines de P sont simples. 


Exemple. Soit n un entier au moins égal à 2 et soit a € C. Le polynôme 2" — a” 
P 8 poiy 
a pour racine a, donc se factorise par z — a. Par exemple, on a les égalités 
a —=(z-a)(2+a) et 25 — a = (z— a)(z? + az + a?) 
Voici la formule générale pour factoriser 2° — a" par 2 — a : 
fe) 20 (nr) RPG er ROSE ess ge an 


La formule est évidente si a —0. Démontrons-la d’abord pour a — 1. Si z est un nombre 
complexe, on a 


2(et th 2h pz+l)=zt pat lt... +2 
12 LEZ LL. Lz +1) = 29 l+...+z+1 
donc en soustrayant (2—1)(2*-1+2%-24...4241)2=2 1, Dans le cas d’un nombre 


complexe a Z O0 quelconque, en remplaçant z par z/a dans l'égalité ci-dessus, on ob- 
2 1] an 1 zn—2 

a a 
chaque membre par a". 


tient | ++ = + 1 L … — 1, d’où l'égalité (x) en multipliant 


n—1 at? 


Remarque 
L'égalité (2—1)(1+2+:..+2% 1) = 27 — 1 s'écrit encore 
lat ——È dei 
— 2 


C'est la formule qui exprime la somme des n premiers termes de la progression 
géométrique de premier terme 1 et de raison z # 1. 


Corollaire. Un polynôme de degré n possède au plus n racines. 


Démonstration. Supposons que les nombres a1,...,a, sont des racines deux à deux diffé- 
rentes du polynôme P. D'après la proposition, il y a un polynôme Q; tel que P=(z-a1)Q1. 
On a 0 = P(a2) = (az — a1)Q1(a2) et a2 — «1 Z 0, donc Q:(a2) = 0. En appliquant la propo- 
sition à Q1, il vient Q1 = (z— a2)Q2, donc P = (2 — a1)(z— a2)Q2, où Q2 est un polynôme. 
On a Qo(a3) = 0, car (az — a1)(az — a2) Z 0. En continuant ainsi, on obtient une factorisation 
P=(z-—a1)(2- a2):::(z-—a,)Q,. Puisque le degré d’un produit est la somme des degrés, 
on en déduit deg P = p + deg Q, > p. = 


Un polynôme de degré n peut avoir moins de n racines : ainsi par exemple, le po- 
lynôme (2-— a)! est de degré 4 et sa seule racine est a. Voici le résultat fondamental 
concernant les racines d’un polynôme. 
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Théorème de D'Alembert-Gauss. Tout polynôme P de degré n > 1 s'écrit 
P=a(z-w)"(z-u)"...(z- ur)", 


avec a 0, des nombres complexes w1,...,ux deux à deux différents et des entiers n1,...,nx 
au moins égaux à 1. On a nitno+---+nx = n et les racines de P sont wi,...,ux. 


Ce théorème, que nous admettons, affirme notamment qu’un polynôme P non cons- 
tant possède toujours des racines dans € et que P est un produit de polynômes 
z— u; de degré 1, chacun des facteurs pouvant être répété plusieurs fois. L’entier n; 
s'appelle la multiplicité de la racine u;. Si n;— 1, on dit que u; est racine simple de P. 


Racines n -ièmes de l'unité. Soit n un entier au moins égal à 2. 
Pour tout entier k tel que 0 <k < n — 1, posons ux = ePkr/n)i, D'après la formule 
de Moivre, on a 


(ux)" = [cos(2kr/n) + isin(2kr /n)]" = cos(2kr) + isin(2kr) = 1, 


donc les n nombres complexes w,...,u,_1 sont racines du polynôme 2” — 1. Le 
polynôme 2" — 1 étant de degré n, il n’a pas d’autre racine, d’où la factorisation 


27 27 . 27 
#—1=(2-1) (2-e%:) (2-er:).. (mn), 


2kr/n)i 


Les nombres uy4 — el s'appellent les racines n-ièmes de l'unité. Remarquons que 
l’on a l'égalité ux = (w1)", avec la convention habituelle (u1)° = 1. 


Exemples 

Les racines carrées de l'unité sont 1 et —1. Les racines quatrièmes de l'unité sont les 
solutions de l’équation 24—1=(2?—1)(2?+1)=0 : ce sont les nombres 1, —1, à, —i. 

Les racines cubiques de l’unité sont les racines du polynôme 2°—1=(2-—1)(2?+2+1), 

V3 Air/3 — j _ _—1 . V3 


et j?=e i 
9 J 


c'est-à-dire nombres 1, j — e2i7/3 — : +i : a 
Puisqu’on a [ux|—1, les points P6,...,P:-_1 d'af- p À 
fixes u0,...,u_1 sont sur le cercle de centre O et 
de rayon 1. De plus, pour k—1,2,...,n—1,ona 
ur = (uw) =uiux 1, donc l'argument de ug/ux-1 
vaut toujours Arg(u1)=27/n. Cela veut dire que 


J+i 


hexagone 
régulier 


> 


les angles OP,OPi, OPi,OP), etc, ont tous la î 
même mesure 27/n, autrement dit les points ) 
P5,...,Pn_1 partagent le cercle en n arcs égaux. 
Les points P6,...,/P,_1 sont donc les sommets 

: ù pentagone 
d’un polygone régulier à n cotés centré à l’ori- > régulier 
gine. Les figures montrent le polygone obtenu 
avec les racines 6-ièmes de l’unité (hexagone) et 
celui correspondant aux racines 5-ièmes (pentagone). 
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Racines n -ièmes d'un nombre complexe. Soit à un nombre complexe non 
nul. Le module |a| est réel et strictement positif. Puisque la fonction x + x" est une 


bijection de [0,+co[ dans [0,+00{, le nombre réel \/|a| existe. Posons a — Arga et 
à» DT; 2kr . 
zx = Ÿ/lalen*e n * pour k entier tel que 0 <k <n—1. Les nombres e n * étant 


racines n-ièmes de l’unité, on a 
nm  » nm ". 
Ga)" = (al) (eñ#) = late = à 
donc 26,...,2-1 sont les n racines du polynôme z” — a. On en déduit la factorisation 
nm 


2% —a—=(z— 20). (2 2n 1). 


Proposition. Soit a un nombre complexe non nul. Les racines n-ièmes de a sont les 


Ar 
nombres complexes de module \/|a| et d'argument ES + 2e, où k=0,1,...,n—1. 


Un nombre non nul, réel ou complexe, possède donc n racines n-ièmes. Remar- 
a . 2kr . 
quons que l’on a 2 — Ÿ/l[alen* et donc z, — ze n * : les racines n-ièmes de a 


s'obtiennent en multipliant par les racines n-ièmes de l’unité. 
Les racines carrées d’un nombre complexe non nul sont deux nombres opposés. 


2.3 Calcul des valeurs d'une fonction polynôme 


Soit P = pn2" +Pn_12% 714... + pz+ po un polynôme non nul et soit u un nombre 
complexe. Pour obtenir la valeur P(u), on peut calculer de proche en proche les 
puissances de u, retenir ces valeurs et en faire la combinaison selon les coefficients du 
polynôme. Voici un algorithme plus rapide : pour un polynôme p32° + p22°? + p12+ Do 
par exemple, on calcule successivement les nombres 


Qg = pau +pP2 , AG —=au+pi et à = au +po 


de sorte qu'on a a = au + po = (aou + p1)u + po 
= au? + piu + Po 
= (pau + pa)u? + piu + po 
= psu + pou? + pau + po = P(u). 
Voici l'algorithme général, appelé méthode de Hürner : 
initialisation : (n+ deg P) (pour à de 0 à deg P, p[i] — coefficient de 2!) (a+ pln]) 
(u + un nombre complexe) 


boucle : tant que n > 0, faire 
a+ au + pÎn — 1] 
nen—l 


fin : la valeur de a est P(u). 
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2.4 Division euclidienne des polynômes 


Nous avons montré qu’un nombre complexe a est racine d’un polynôme À si et 
seulement si À est multiple du polynôme z — a. Plus généralement, si À et B sont 
des polynômes, on peut se demander si À est multiple de B, c'est-à-dire s’il existe 
un polynôme Q tel que À = BQ et si oui, comment calculer le quotient Q. 

Étant donnés des polynômes À et B, le polynôme À n’est en général pas multiple de 
B, mais on peut trouver, parmi les multiples de B, celui qui diffère de À par un poly- 
nôme de plus petit degré possible. En appelant BQ ce multiple, on aura précisément 


deg(BQ) = deg A et deg(A — BQ) < degB si À £ BQ. 
Exactement comme pour les entiers (voir page 4), on dispose sur les polynômes 


d’une division avec reste : le reste de la division du polynôme À par le polynôme 
B doit être, pour ce qui est du degré, «plus petit» que B. 


Théorème. Soit À un polynôme et soit B un polynôme non nul. Il existe des polynômes 
Q et R uniques tels que A= BQ+R et (R=0 ou deg R < deg B). Le polynôme 
R s'appelle le reste de la division de À par B et Q est le quotient. Le polynôme A est 
multiple de B si et seulement si le reste de la division de À par B est nul. 


Calculer le quotient Q et le reste À, c’est effectuer la division euclidienne de À par B. 
On a A= BQ si et seulement si R—0. Cela veut dire que le polynôme À est multiple 
du polynôme B si et seulement si le reste de la division de À par B est nul. La 
division est donc un outil pour savoir si un polynôme se factorise par un autre. 
Montrons sur des exemples comment se pratique la division. 


Exemple 1. Posons À — 24423-32415 et B=2? +1. En ajoutant (ou en re- 
tranchant) à À un multiple de B, on cherche à transformer A en un polynôme 
A1 de degré plus petit que 4. Visiblement, si l’on retranche à A le polynôme 
22?B = 224 +22?, le terme 2z{ disparaît de A et l’on obtient le polynôme 


A=A-2/B=28-92 345 


qui est de degré 3 < deg À. Continuons ainsi : en retranchant à A1 le polynôme 
2B = 2? + 2, on obtient 


A = A —2B=-922? -42+5. 
On forme enfin le polynôme 
R=A+2B=-22 -42+54+(22 +2) = -4:+7 


qui est de degré 1 < deg B. Par conséquent, le reste de la division de À par B est 
R = —4z +7. Pour calculer le quotient, exprimons À au moyen de A; , puis de A: 
et R : il vient 


A=2#B+A =2#B+2:B+A =2#B+2:B-2B+R=(22+2-2)B+R. 
Le quotient est Q = 22? + z — 2 et l’on a bien l'égalité de division À = BQ +R. 
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Dans la pratique, on conduit les calculs comme pour une division ordinaire entre 
nombres, en écrivant au fur et à mesure les quotients partiels sous le diviseur. 


Exemple 2. Calculons le quotient et le reste de la division de 2°+21+2%+82?2+92+8 


par 2 +8. 

On écrit : 4 : 9 3 
2° + 2° + 2° +82 + 9z +8 |2°+8 
=35 .. P+s+l 

“ + 2 + 9z +8 
7 | — 8z 
2 + z +8 
— 2% — 8 
z 


Le quotient 22+3+1 apparaît sous le diviseur, le reste est z et l’on a l'égalité de division 
Pris r8+02+8— (2% +8)(2 +2+1)+2. 

Exemple 3. Factorisons le polynôme P = —21+22% - 52? + 8z — 4 en produit de 

facteurs de degré 1. 


On a P(1) =0, donc 1 est racine de P. Par suite, P est multiple de z2—1. En 
effectuant la division de P par z— 1, on obtient 


P=(zg-1)(-2 +3 -423+4)= (2 —1)(2 — 3? + 43-04) 
= —(z- 1)[eète —1)+4(2-1)] =-(2- 1)(2? +4). 
Les racines de z? +4 sont 24 et —24, donc P = —(z—1)?(z—24)(z+ 26). 
Division par z — a. Si P est un polynôme et a un nombre, le reste de la division 
de P par z— a est P(a). 


En effet, d’après la formule de Taylor pour les polynômes, il existe un polynôme Q tel 
que P = P(a) +(z—a)Q, ou encore P = (z — a)Q + P(a). 


Polynômes étrangers 
Définition 
Si des polynômes non nuls À et B n’ont pas de racine commune (réelle ou 


complexe), ont dit qu’ils sont étrangers. 


Exemple. Si a et b sont des nombres complexes différents, les polynômes (2 — a)" 
et (2 — b)? sont étrangers, quels que soient les entiers positifs n et p. 


Proposition. Des polynômes À et B sont étrangers si et seulement s'il existe des 
polynômes U et V tels que AU + BV = 1. 
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Démonstration. Une racine commune à À et B est aussi racine de AU+BV :si AU+BV=1, 
les polynômes À et B sont donc étrangers. Réciproquement, supposons À et B étrangers, 
deg B < deg À et raisonnons par récurrence sur le degré de B. Si deg B = 0, alors B est 
une constante b non nulle et l’on a 0A + (1/b)B = 1. Supposons deg B > 1 et effectuons la 
division euclidienne de À par B : A= BQ +R, où le reste est R. D’après cette relation, 
toute racine commune à B et R est racine commune à À et B, donc B et R n'ont pas de 
racine commune. De plus, R n’est pas nul, sinon À serait multiple de B et les racines de B 
seraient racines de À. Ainsi B et À sont étrangers. Puisqu'on a deg R < deg B, l'hypothèse 
de récurrence assure qu'il existe des polynômes U et V tels que BU + RV = I. Il vient alors 
AV = BQV + RV = BQV +1- BU = B(QV —U) +1, d'où AV + B(U-QV)=1. sl 


2.5 Rappels sur l'équation du second degré 


Une équation du second degré est une équation de la forme 

2 +pz+q=0, où p et q sont des nombres réels ou complexes. 
Pour résoudre l'équation, on remarque que z? + pz est le début du développement 
de [2+ (p/2)}°. Précisément, on a 2? + pz = [2+ (p/2)|° — p?/4, d'où 


2 + pz + q = [2+(p/2)]° — p?/4+ q = [2+(p/2)]° — — 


Posons À = p? — 4q : c’est le discriminant du polynôme 2? + pz + q. 


Premier cas : À 0. Il existe alors deux nombres complexes Ô et —Ô tels que 
P=(-0) =A.Ona 


2 +pr+q= (2+2) (é) - (+5-9)(4+14+0 


2 DU D 
Les racines de 2? +pz+q sont donc les deux nombres z — : + ; et 22 = =. - ; 
Second cas : À — 0. L'équation s'écrit |z + (p/2)|° = 0. Il n’y a qu’une solution : 


21 = —p/2 = 2. 
Dans tous les cas, on a la factorisation 2? + pz + q = (2 — z1)(z — 2). Puisque 
(2 — 4)(2— 2) = 2? — (41 + 2)z + 2120, on en déduit les égalités 
p=-(a+z) et q—= 212% 
qui expriment la somme et le produit des racines au moyen des coefficients de 
l'équation. 


Cas où les coefficients sont réels. Supposons que les coefficients p et q sont 
des nombres réels. Le discriminant À = p? — 4q de l'équation est alors un nombre 
réel. L'égalité 

2 

a? + pr + q = [x + (p/2)] — A/4 

montre que lorsque x décrit l’ensemble des nombres réels, le minimum de x? + px +q 
est obtenu pour la valeur —p/2 de la variable et que ce minimum vaut —A/4. 
Il est facile de déterminer le signe de 2? + pr + q : 
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Si A<0,ona x +pr+q=[r+ (p/2)|° — A/4> —-A/A > 0 pour tout x réel. 


Si A0, on a 2?+pr+q= [x+(p/2)] ?>0, la valeur 0 étant obtenue lorsque x——p/2. 

Supposons À > 0. L'équation a deux racines réelles 1,22 et l’on a la factorisation 
x? + pr + q = (x —21)(x — 2x2). Si x est strictement compris entre æ1 et 2, alors 
x? +px+q<0.Si x est en dehors de l'intervalle d’extrémités 21,12, alors x?+pr+q>0. 
Le produit des racines est q : si g < 0, les racines sont de signes contraires; si 
q > 0, les racines sont de même signe, celui de leur somme —p. 


Exemple. On dispose d’une peinture dont deux composants a et b s’oxydent len- 
tement à l'air. Après une série de mesures, on constate que si a et b sont présents 
en quantité x et y, alors au bout d’un an, les quantités sont 

z'=y-kz et y —=ky-x, 
où k est un paramètre positif qu’on peut faire varier en incorporant des produits 
additifs. Afin de stabiliser la peinture, on souhaite que la proportion entre les deux 
substances oxydables a et b ne varie pas. Cela est-il possible ? 
La proportion initiale entre les quantités de a et de b est le rapport x/y. On doit 
donc chercher s’il existe des valeurs x et y telles que x/y = x'/y. 
Posons t=x/y et t’=x'/y. On a x/=y—kx=y(1-kt) et yÿ —=ky—x=y(k-t), donc 
l—= _ ï. L'égalité { = t s'écrit t{ — _ #, c'est-à-dire t(k — t) — 1 — kt ou encore 
(+) #2 —2kt+1—0. 


Cette équation du second degré a pour discriminant À = 4(k? — 1). 

Si 0O<k<1, l'équation (+) n’a pas de solution réelle : pour ces valeurs du 
paramètre k, la proportion entre les produits a et b ne reste pas constante. 

- Supposons > 1. L'équation a pour solutions t1=k—VKk? — I et t>—k+V#k? — TI. Les 
nombres {, et f sont positifs, car leur produit est 1 et leur somme 2k > 0. Puisque 
y =y(k—t), le nombre t doit vérifier l'inégalité k—t>0. On a k—t1— VEk2=1>0 
et k—t2 = —Vk? — 1 < 0, donc la seule possibilité est k > 1 et t — t1. 

- Supposons k> 1 et posons t—k—1k? — 1. En partant de quantités positives x et y 
vérifiant æ=ty, on obtient y/=y(k—t)>0 et aussi x/=ty'>0 : au cours de la première 
année, la proportion entre a et b est restée fixe : nécessairement, elle le restera ensuite. 


Comment les quantités x et y ont-elles varié en un an? On a 
Y = y(k-t)=yvk?-1 
a = ty =tyVk = 1=xVk 1 


donc les quantités x et y ont été multipliées par le même facteur Vk? — 1. 
Puisque les valeurs x et y n’ont pu que diminuer au cours du temps, c’est que l’on 


a Vk?— 1 <1, donc 1 < k < V2. 
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a Exercices mms 


@ 1. Les transformations homographiques. On ajoute à l’ensemble C des nombres complexes 
un élément œ qui n’est pas un nombre et l’on note C =CU {oo} l’ensemble obtenu. 
Soient u,v,c,d des nombres complexes tels que c Z 0 et v 0 et soit f: € — C 
l'application définie en posant 

CG) = u + à sizEeC\{-d/c}, f(-d/c) = et f(oo) = u. 


a) Montrer que f est une transformation bijective de C. 


b) Montrer que l'application f possède deux points fixes si et seulement si 
(d + uc)? + 4cv £ 0. 
On suppose désormais que f possède deux points fixes p et q et l’on définit 
l'application  : © — € en posant 


o(9 = TS si 2€ C\{a}, pl) = 00 et p(o0) = 1. 


c) Montrer que 4 est une bijection. 
d) Transportons f par le changement de référentiel 4 : on obtient une transformation 
cq + d 
cp + d 


g de C. Montrer qu’en posant X — , On a 


g(co) = æ et g(z) = Kz pour tout z € C. 


@ 2. Une itération homographique. Soit 7 — ]1/2,+00[. Pour tout nombre x € I, on pose 


IQ) = 


 2r+1 
a) Déterminer des nombres u et v tels que f(x) = u + 


v 
our tout x € I. 
2z +1 lé 


b) Montrer que f définit une transformation de l'intervalle Z et déterminer le point 
fixe de cette transformation. 


f(@)-1 2 æ—1 


c) Montrer que pour tout x€ 1,ona FG) 1/2  32-1/2 


d) Soit x, € Î et soient x1,...,x%,,... les itérés de xo par l'application f. Montrer 
; Ln — L 2\% xo—l 
ue pour tout entier n >1,ona L = ( ) ; 
qe P di Tn — 1/2 3/ xo—1/2 


e) Quelle est la limite de x, quand n tend vers l'infini ? 


Dans les deux exercices suivants, on pourra utiliser la formule du binôme de Newton qui 
figure page 61. 

3. Utilisation de la formule de Moivre 
a) Exprimer cos 2a au moyen de cos a et de sin a. Faire de même pour sin 2a. 


2tana 3tan a — tan a 


;— et tan 3a — L 
1—tan a 1—3tan°a 


b) Montrer que tan 2a = 


€) Démontrer les égalités cos 3a = 4 cos? a — 3 cos a et sin 3a — 3sin a — 4sin° a. 
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@ 4. Mesures du pentagone régulier 


@ 5. 


7. 


a) Démontrer l'identité cos 5a = cos? a — 10 cos? a sin? a + 5cos asin* a en utilisant la 
formule de Moivre. En déduire que les nombres cos(27/5) et cos(4x/5) sont 
racines du polynôme P = 1625 — 202% +52 — 1. 


b) Montrer que P = (z — 1)(42? + 22 — 1)?. En déduire cos(27/5) — =, 


c) Montrer que le coté du pentagone régulier inscrit dans un cercle de rayon À a 


V5 


pour longueur R IT. Pour une construction géométrique du pentagone, voir 


à la fin des exercices. 


d) Montrer que cos(x/5) — Le (utiliser la valeur connue de cos(27/5)). 


a) Soient a, b, c des nombres complexes de module 1 tels que a+b+c—0. 
(i) Montrer que l’on a 1+2%e(ab) — 0. 
() En déduire que l'argument de b/a est égal à 27/3 ou à 47/3. 


b) Soient u, v et w des vecteurs du plan euclidien. On suppose que ces vecteurs 
sont de même module non nul et que leur somme est nulle. Montrer qu'entre 
deux de ces vecteurs, l’angle mesure 120 degrés. 


. Cet exercice est une application du précédent. On considère le dispositif méca- 


nique ci-contre formé de trois poulies et de fils où sont 
suspendues des masses égales. 


a) Montrer qu’au point d'équilibre ÆE, les tensions sur tous 
les fils ont le même module. 


b) En déduire l’angle au point Æ entre les directions des fils. 


c) On rappelle que si P, Q, R sont trois points d’un cercle 
de centre O, «l'angle inscrit » PQ, PR vaut, à 180 de- 


grés près, la moitié de «l’angle au centre » O0Q,OR. En déduire une construction 
géométrique du point d'équilibre E. 


Pavage hexagonal. On se place dans le plan euclidien muni d’un repère orthonormé. 
Soit P l'hexagone régulier inscrit dans le cercle de rayon 1 centré à l’origine et 
ayant deux cotés parallèles à l’axe Ox. 


a) Quelles sont les affixes des sommets de P ? Quelle est la longueur 
du coté de P ? 


b) Soit P' l’image de P par la translation de vecteur d’affixe 3 et soit 
P' Vimage de P par la translation de vecteur d’affixe u = 1+eT/5. 
Montrer que P” a un coté en commun avec chacun des hexagones 
P et P'. 
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@ 8. 


@ 2. 


10. 


11. 


@ 12. 


c) Pour tous entiers relatifs k£ et n, notons P;, l'image de P par la translation du 
vecteur d’affixe ki +nu. 
(il Quels sont les couples (k,n) correspondant à des hexagones P;, ayant avec 
P un coté en commun ? 
ii) Montrer que les intérieurs des hexagones PF; forment un pavage du plan. Quelle 
est la distance entre les centres de deux hexagones ayant un coté en commun ? 


Expression d'une symétrie à l'aide des nombres complexes. On se place dans le plan eu- 
clidien muni d’un repère orthonormé. Soit D une droite passant par l'origine © et 
soit a l’affixe d’un vecteur directeur de D. Pour tout z € C, on pose s(z) — az/à 
et si M est un point d’affixe z, on note M le point d'affixe s(z). 


a) Montrer que si M € D, alors M = M. 

b) Montrer que le vecteur d’affixe a à est orthogonal à D. 

c) Montrer que si le vecteur OM est orthogonal à D, alors OM' est orthogonal à D. 
d) En déduire que M’ est le symétrique de M par rapport à D. 

Polynôme de degré 3 ayant une racine multiple. Soit le polynôme P = 2° + pz + q, où 
p et q sont des nombres réels ou complexes. 


a) On suppose que P a une racine multiple a. Démontrer les égalités a? = —p/3 et 
a(—p/3) + ap + q = 0. En déduire que l’on a 4p° + 27q° = 0. 

b) Supposons 4p° + 27q° = 0. 
(i) Soit a une racine carrée de —p/3. Montrer que q/2 = +a et que P(a) = q—2a*. 
) En déduire que a ou —a est racine multiple de P. 


Factorisations de polynômes 

a) Soit le polynôme P = 421-1223 +172? — 24: + 18. Effectuer la division de P par 
le polynôme 2? + 2. En déduire les racines de P. 

b) Montrer que 1 et —1 sont racines multiples du polynôme Q=32°+21-62%-222+32+1. 
Trouver toutes les racines de Q. 

«) Trouver un polynôme R de degré inférieur ou égal à 2 tel que 2—-52%+5:?+32+7-R 
soit multiple du polynôme (z — 3)?. 


Soient p et q des nombres réels. Notons z et 22 les solutions de l'équation 
2? + pz+ q = 0. Montrer que z1 et z sont de parties réelles strictement négatives si 
et seulement si p et q sont strictement positifs (on distinguera le cas où les racines 
sont réelles du cas où elles ne le sont pas). 


Fonctions du second degré à deux variables. Soient p et q des nombres réels et soit 
f:R?—R la fonction définie par f(x,y) = x? + 2pxy + qy°. 


a) On suppose p? < q. Montrer que f(x,y) est strictement positif si x ou si y n’est 
pas nul. Quelle est la valeur minimum de la fonction f ? 
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@ 13. 


b) On suppose p? > q. Montrer qu’il y a deux nombres réels u et v différents tels 
que f(x,y) = (x +uy)(x + vy) pour tout (x,y). En déduire que f(x,y) ne garde 
pas un signe fixe. 

c) On suppose f(x, y) = x? — xy — 2y°. 

{ Décomposer f (æ,y) en produit de facteurs comme en ({b}, en calculant les 
nombres u et v. ._ 

(ü) Définir un repère (O;i,j') du plan euclidien R? dont les axes ont pour équation 
x + uy = 0 et x + vy = 0. Quelle est l’équation d’une ligne de niveau de f dans 
ce nouveau repère ? 

(iü) Dessiner sur un même dessin les lignes de niveau —1, 0, 1 et 2 de la fonction f. 


Effet multiplicateur en Économie. Quand des acteurs économiques (particuliers, collec- 
tivités ou entreprises) disposent d’une somme d’argent, ils en dépensent une partie 
auprès des autres et épargnent (ou capitalisent) le reste. Supposons qu'une poli- 
tique de baisse d'impôts ou le financement de grands travaux, par exemple, mette 
à disposition des acteurs économiques une somme d'argent S. Supposons aussi que 
lorsqu'ils disposent d’une somme d'argent, les acteurs en redépensent tous la même 
fraction c, où 0 < c < 1; le nombre c s'appelle la proportion marginale à consommer. 
Notons S, le cumul des sommes utilisées en consommation après n transactions. 


Calculer S, et montrer que lim Sn = Le coefficient k = s'appelle le 
n—+00 —C IC 


coefficient multiplicateur. Combien vaut k lorsque les acteurs redépensent 75% de la 
somme à disposition ? Quel est l'intérêt économique d’un tel processus ? 


Construction d'un pentagone régulier inscrit dans un cercle 


— UU' est un diamètre, OV est un rayon perpendiculaire 


V_P 
 w est le milieu de OU 1 
 K est défini par wK = wV CAS 
— H est le milieu de OK 
— HP est perpendiculaire à OU. U' U 


Alors l’angle OU,OP vaut s , OH = cos 7 et 


UP est le côté du pentagone régulier. Da 
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Chapitre 3 


Dénombrement, 
permutations, graphes 


1. Ensembles finis 
1.1 Définition et propriétés 
Un ensemble E est fini s’il possède un nombre fini d'éléments. 


Si E est un ensemble fini ayant au moins un élément, alors en numérotant ses éléments 
à partir de 1, on obtient E—{a1,a2,...,a,}. L'entier n est le nombre d'éléments de E. 


Il y a en général plusieurs façons de numéroter les éléments de E, mais le nombre 
d'éléments ne dépend pas de la numérotation choisie. On convient que l’ensemble vide 
est fini et que son nombre d'éléments est zéro. 


Notation : Notons |Æ| le nombre d'éléments de l’ensemble fini E. 
Des ensembles finis E et Font le même nombre d'éléments si et seulement 


s'il existe une application bijective de E dans F. 


Voici des propriétés très simples concernant les parties d’un ensemble fini. 


Proposition. Soit E un ensemble fini à n éléments. 
Toute partie de E est finie et possède au plus n éléments. 
— Si À est une partie de E et si A possède n éléments, alors A = E. 


Proposition. Si À et B sont des parties finies d'un ensemble, alors la partie AU B est 
finie et l’on a 

[AU B|+|ANB]|=/|A|+1/B|. 
Démonstration. Si l'intersection AN B est vide, le nombre d'éléments de AU B est |[A|+|B] 
et la formule est vraie. Dans le cas général, les parties À et B\(ANB) sont disjointes et leur 
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réunion est AU B ; on a donc [AUB|=}A]+|B\(ANB)|. Les parties AN B et B\(ANB) 
sont disjointes et leur réunion est B, donc on a [B\(ANB)|=|B|-|ANB|, d'où la formule. 8 


Proposition. Soient E et F des ensembles finis. 


Le nombre de couples (x,y) tels que xEE et yEF est |E||F| : on a donc [Ex F|-|E||F|. 
— Le nombre d'applications de E dans F est |F|F1. 

Démonstration. Posons n = |E| et p—|F|. Il y a n façons de choisir un élément de l’en- 
semble Æ et pour chacun de ces choix, il y a p façons de choisir un élément de l’ensemble F. 
Il y a donc np couples (x,y) tels que x € E et yEe F. Pour définir une application f:E—F, 
il faut, pour chaque élément x € E, choisir son image f(x) parmi les éléments de F : pour 
chaque élément de E, il y a donc p choix possibles. Puisque ÆE possède n éléments, il y a 
pxpx:--.xp=p" choix pour définir une application de E dans F. [| 
SE ————  — 


n facteurs 


Dans un ensemble fini, il y a évidemment un nombre fini de parties : par exemple, 
l'ensemble {a,b,c} a pour parties @, {a}, {b}, {c}, {a,b}, {a.c}, {b,c} et {a.b,c}. 


Corollaire. Dans un ensemble à n éléments, il y a 2" parties. 


Démonstration. Soit Æ un ensemble à n éléments et soit P l’ensemble des parties de E. 
Nous allons établir une bijection entre P et l’ensemble 4 des applications de E dans {0,1}. 
Puisqu'il y a {0,171 
À toute partie À de EF, associons la fonction ca : E — {0,1} définie en posant ca(x) = 1 si 
x € À, ca(x) = 0 si x & A. La fonction c4 s'appelle la fonction caractéristique de la partie A. 
À toute fonction f : E — {0,1}, associons la partie X; de E formée des éléments x € E tels 
que f(x) = 1. 

La fonction caractéristique de la partie X; est f et si À est une partie de Æ, alors la partie 
associée à la fonction c4 est À. L'application A+ cA est donc une bijection de P dans 


— 2" éléments dans l’ensemble Z, cela démontrera le corollaire. 


et l’application f - X}; est la bijection réciproque. ü 


1.2 Applications entre ensembles finis 


Soient Æ et F° des ensembles finis et f : £ — F une application. 

Rappelons que l’image de l'application f est l’ensemble, noté f(E), des éléments 
f(x), où x parcourt Æ. Les éléments f(x) ne sont pas nécessairement tous diffé- 
rents (si f est une application constante, ils sont tous égaux), mais en tous cas, leur 
nombre est inférieur ou égal au nombre d'éléments de Æ. On a donc [f (E)| < |E|. 
De plus, f(E) étant une partie de F, on a |f(E)| < |F|. 

Résumons ces propriétés : 

— Le nombre d'éléments dans l'image de f est inférieur ou égal à |E| et à |F|. 

— On a f(E) = F si et seulement si | f(E)| = |F|. 

En particulier, si Æ a strictement moins d'éléments que F, il existe au moins un 
élément de F qui n’a pas d’antécédent par f. 
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Proposition. Soient E et F — {b1...,b,} des ensembles finis et soit f : E — F' une 
application. Pour chaque entier à € {1,...,n}, soit À; l’ensemble des antécédents de b;. 
Alors on a |Ail+:-:+1A4,| =/|E|. 


Démonstration. On sait (page 21) que les parties A; et À; n’ont pas d’élément en commun 
si i Z j et que la réunion des parties À; est l’ensemble Æ tout entier. Le nombre d'éléments 
de E est donc la somme |A:|+--:+|A4,|. ü 


Voici des propriétés importantes concernant les applications entre des ensembles finis 
ayant le même nombre d'éléments. 


Proposition. Soient E et F des ensembles finis ayant le même nombre d'éléments et 

soit f : E — F une application. 

i) L'application f est une bijection si et seulement si [f(E)| =|F|, 

ü) L'application f est une bijection si et seulement si tout élément de F a au plus un 
antécédent par f. 


Démonstration. Si f est une bijection, alors par définition, on a f(E) = F et tout élément 
de F° a exactement un antécédent par f. 

Posons F = {b1,...,b,} et pour tout entier à compris entre 1 et n, notons À; l’ensemble des 
antécédents de b;. D’après la proposition précédente, on a |E| = |A] +:.:+]4,| et comme 
LE| = n par hypothèse, il vient 

(+) (AD 4s+ (le = lAlt--tl4lene|isl-n=0 

Supposons que f(E) et F ont le même nombre d'éléments. On a donc f(E)=F, car f(E) 
est une partie de F. Puisque tout élément de f(E) possède par définition un antécédent par 
f, on en déduit que tout élément de F possède au moins un antécédent, autrement dit nous 


avons |A;| > 1 pour tout à. Chacun des entiers |A;| — 1 est positif ou nul, leur somme est 
nulle d’après (+), donc on a |A;| — 1 = 0 pour tout à : chaque partie À; possède donc un et 
un seul élément. Cela veut dire que chaque élément de F a un et un seul antécédent, donc 
l'application f est bijective. Nous avons ainsi démontré la propriété (i). 

Supposons maintenant que chaque partie À; possède au plus un élément, donc |A4;] < 1 pour 
tout à. Les entiers |A;| — 1 sont négatifs ou nuls, leur somme est nulle d’après (x), donc ils 
sont tous nuls. Ainsi l’on a |A;| = 1 pour tout à et l’on conclut comme précédemment que f 
est une bijection, ce qui démontre (ii). = 


Principe des tiroirs. Soient E et F des ensembles finis et soit f:E— F une application. 
Si|E|>|F|, alors il existe des éléments a et a! appartenant à E tels que aa’ et f(a)= f(a'). 


Démonstration. Reprenons les notations introduites dans la démonstration précédente et 
supposons |E| > |F|. On a donc |A1|+:-:+14,| =|E| > n. Puisque les nombres |A;| sont 
des entiers positifs ou nuls, on en déduit que l’un au moins est strictement supérieur à 1. 
Soit à tel que |A;| > 1. Alors il existe dans À; au moins deux éléments a et a’ différents et 


l'on a f(a) = b;, f(a’) = b;, donc f(a) = f(a’). ü 


Cette propriété s'appelle le principe des tiroirs, car lorsqu'on range plus de n objets 
dans n tiroirs, l’un des tiroirs doit contenir au moins deux objets. 
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1.3 Des dénombrements utiles 


Si des ensembles finis E et F ont le même nombre d'éléments, on sait qu’il existe 
des applications bijectives de E dans F. Calculons le nombre de ces bijections. 


Proposition. Si E et F sont des ensembles finis ayant le même nombre n d'éléments, 
il y a n! applications bijectives de E dans F. 


Démonstration. Posons E = {a1,...,a,} et F—{b1,...,b,}. Pour définir une bïjection de 
f:E—F, on peut choisir l'élément f(ai1) arbitrairement dans F; l'élément f(a2) doit être 
différent de f(a:), ce qui laisse n—1 possibilités ; ensuite, il reste n—2 possibilités pour choisir 
f(a2), et en général n—k possibilités pour choisir f(ax). Finalement, il y a n(n—1)---2-1 
possibilités pour définir une bijection de Æ dans F. ü 


Quand on se donne un ensemble fini E sous la forme E—{a;,...,a,}, les éléments de 
E ont été ordonnés : il y a un premier élément a:, un deuxième a, etc. Si l’on change la 
numérotation, les éléments de E sont les mêmes, maïs l’ordre est différent. Numéroter 
les éléments de E, c’est établir une bijection de l’ensemble {1,2,...,n} dans Æ. D'après 
la proposition précédente, il y a donc n! façons de numéroter les éléments de Æ£. 


Nombre de p-arrangements 
Définition 
Soit E un ensemble fini à n éléments et soit p un entier tel que 1 <p <n. Un 
p-arrangement d'éléments de E est une suite (ai,a>,...,a) de p éléments de E 
deux à deux différents. 


Pour définir un p-arrangement (a1,a,...,a,) d’un ensemble E à n éléments, il y 
a n façons de choisir a, n—1 façons de choisir a2 (car a2 doit être différent de a1), 
etc, donc finalement n(n—1)-:-(n—p+1) façons de choisir les éléments a1,...,a,. 


Proposition. Soit E un ensemble à n éléments. Si p est un entier tel que 1 <p <n, 
n! 

(np)! 

Si E est un ensemble à n éléments, un n-arrangement de ÆE est une bijection de 

{1,2,...,n} dans E : on retrouve ainsi qu’il y a n! bijections entre deux ensembles à 


n éléments. Ainsi, on a l'égalité 0! — 1. 


le nombre de p-arrançements de E est n(n—1):--(n—p+1) = 


Nombre de parties à p éléments 


Proposition. Soit E un ensemble à n éléments. Si p est un entier tel que O0 £p<n, 
n! 

pl(n-p)!" 

Démonstration. Il n’y a qu’une partie à zéro éléments : la partie vide; le résultat est donc 

vrai si p = 0, car par convention, 0! = 1. Supposons p > 1. Soit À une partie de Æ ayant p 

éléments. Les p-arrangements de Æ formés avec les éléments de A sont définis en se donnant 

une bijection de {1,2,...,p} dans À. Il y a pl! bijections de {1,2,...,p} dans À, donc il y a 


le nombre de parties de E ayant p éléments est 
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p! p-arrangements formés avec les éléments de A. Comme le nombre de p-arrangements de 


! 2 : Fe 1 n! : & 212 
E est =", on en déduit qu'ilya À arties de E à p éléments. [| 
(n—p)! TOYS p(n-py P 
Définition 
! 
Soit n un entier positif ou nul et soit p un entier relatif. Si 0<p<n, l’entier PT Le ï 
n—p 
s'appelle un nombre binomial et se note (9). Si p < 0 ou si p > n, on pose () = 0, 


- On a (9) = (”) = 1 et () = en — n, car dans un ensemble E à n éléments, 


l'unique partie à O éléments est l’ensemble vide, l'unique partie à n éléments est 
E lui-même et il y a n parties à 1 élément. 

> Ona () — (a) : en effet, si à toute partie À de Æ on associe son complémentaire 
E \ À, on réalise une bijection entre les parties à p éléments et les parties à n —p 


éléments. 


Nous avons montré dans le premier paragraphe qu’un ensemble à n éléments possède 
2" parties. On a donc l'égalité 


QC) (D- 


Voici une importante propriété des coefficients binomiaux ; elle se vérifie par simple 
calcul à partir de la définition. 


n\ __fn-1 n—1 
Proposition. Pour tous entiers n >1etpEZ,ona () = ( ) + Ca: 
Formule du binôme de Newton. Soient a et b des nombres réels ou complexes, 
ou bien des polynômes à coefficients réels ou complexes. Pour tout entier n > 2, on a l'égalité 


(a+ b}" = a° + (jet (jones. ce (rjortura. dE (jura. 


- Pour n=2, on retrouve la formule connue (a+ b)? = a? + () ab+b? = a? +2ab+b?. 


On a () = (?) = 3, d'où (a+ b}* = a° + 3a?b+ 3ab? + b*, formule qu'il est bon de 


connaître. 
— On a de même (*)}—(:)=4 et () - ; 326, donc (a+b)=at+4a%b+6a?b?+4ab%+b". 


1 3 


Démonstration. Développons le produit (a+b)" = (a +b)(a+b)--:(a+b) en une somme 


n facteurs 


de termes. Un terme quelconque du développement s'obtient en choisissant, dans chaque fac- 
teur (a +b), l’un des nombres a ou b et en faisant le produit : si l’on choisit le terme a dans 
k des facteurs, on obtient le terme a“b"-* dans le développement. Pour tout entier k compris 
entre 0 et n, il y a (*) façons de choisir k facteurs parmi n, donc () termes a“b"-* dans 
le développement de (a +b)". Le produit (a +b)" est donc égal à la somme des (#)a“b"—#, 


où k parcourt les entiers compris entre 0 et n. Si k=0, on a (})a*b"-k = (G)a0br = 7; 
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car a) = let a =1; si k=n, alors (jar = ()a"b° =", car (7) = 1; dans le cas 


général, on a (janerÀ — En a d’où la formule. = 


Corollaire. Soient n et p des entiers tels que 1 <p <n. Il y a (F) applications 
strictement croissantes de {1,...,p} dans {1,...,n}. 


Démonstration. Si w est une application strictement croissante de {1,...,p} dans {1,...,n}, 
on a u(1) < u(2) < -:- < u(p), donc les éléments u(1),...,u(p) sont deux à deux différents 
et l’ensemble {u(1),...,u(p)} est une partie à p éléments de {1,...,n}. 

Notons S l’ensemble des applications strictement croissantes de {1,...,p} dans {1,...,n} et 
P l’ensemble des parties à p éléments de {1,...,n}. À toute application strictement croissante 
u:{1,...,p} — {1,...,n}, associons la partie {u(1),...,u(p)}. On définit ainsi une application 
f:$S— P. Montrons que f est une bijection, ce qui prouvera le corollaire. 

Soit U une partie à p éléments de {1,...,n}. Rangeons les éléments de U dans l’ordre crois- 
sant : on obtient U = {u:,...,u,}, où les entiers u; vérifient 1 <u1 <--:<u, <n. Définissons 


strictement croissante et {u(1),...,u(p)} =U, autrement dit u est un antécédent de U par f. 


l'application u : {1,...,p} — {1,...,n} en posant u(i) = u; si 1 << p. L'application uw est 


Supposons que v est un (autre) antécédent de U.OnaveS, donc u:{1,...,p} —{1,...,n} 
est une application strictement croissante; de plus, on a f(v) = U, donc {v(1),...,vu(p)} = 
U = {u(1),...,u(p)}. Puisque v est strictement croissante, on a v(1) <-:-:<w(p). On en déduit 
les égalités v(1) = u(1),...,v(p) = u(p), donc v = u. 

Par l'application f : S — P, tout élément de P possède exactement un antécédent. L'application 
f est donc bijective. ü 


Nombre d'applications croissantes 


Dans ce paragraphe, p est un entier au moins égal à 1 et n est un entier positif ou nul. 
Considérons les inéquations suivantes 


(1) mi+tt  +mE<N ;, EeN,x2>l 
(2) mi+tt + EN ;, x; EN 
où l’inconnue est une suite (x1,...,æ,) d’entiers positifs ou nuls pour (2), d’entiers 


strictement positifs pour (1). 
Voici deux interprétations utiles pour les solutions de ces inéquations. 
A) Il y a une bijection entre les solutions de (2) et les applications croissantes 
de {1,...,p} dans {0,1,...,n}. 
Si s=(21,...,2,) est une solution de (2), on définit l'application 
us :{1,...,p} — {0,1,...,n} 


en posant u,(k) = 21 +-.:+xx si 1 <k < p. Puisque les entiers x, sont positifs ou 
nuls, l'application u, est croissante. 


Réciproquement, supposons que v est une application croissante de {1,...,p} dans 
{0,1,...,n}; posons æ1 =v(1) et xx, =v(k)—v(k—1) pour 2<k<p; par hypothèse, 
on a æ1 >0 et xx = U(k) — u(k — 1) > 0 pour 2 < k < p, donc (x1,...,x,) est une 
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suite d’entiers positifs ou nuls; pour tout entier k tel que 1<k<9p,ona 
Tite +æe = 0(1) + (v(2) — v(1)) ++: + (u(k) — v(k — 1)) = v(k) <n. 


La suite s = (x1,...,x,) est donc une solution de (2) et l’on a vu = us. 


8) Il y a une bijection entre les solutions de l'inéquation (1) et les applications 
strictement croissantes {1,...,p} — {1,...,n}. 


Remarquons que toute solution de (1) est aussi une solution de (2). Supposons que 
s=(21,...,7,) est une solution de (1). Puisque les entiers x} sont tous au moins égaux 
àl,onan>zr+...+1,2p, doncn>p2>1. L'application u, est strictement crois- 
sante et comme on a u.(1)=x1 > 1, u, prend ses valeurs dans l’ensemble {1.. ” n}. 
Réciproquement, si u, prend ses valeurs dans {1,...,n} et est strictement croissante, 
alors on a 21 = u,(1) > 1 et xx = u,(k) — us(k—1) > 1 pour tout entier k compris 
entre 2 et p. 


Proposition 
i L'inéquation (1) possède (5) solutions. 
ü) L'inéquation (2) possède Er solutions. 


ü) Si n > 1, le nombre d'applications croissantes de {1,...,p} dans {1,...,n} est de) 
Démonstration. On sait qu’il y a (7) applications strictement croissantes de {1,...,p} dans 
{1,...,n}, donc l’inéquation (1) possède (5) solutions. 
On peut facilement passer d’une solution de (1) à une solution de (2) et vice-versa : 
si (21,...,%,) est une suite d’entiers, posons y; = 1+%; pour 1<i<p. On a alors 
Yyi+ + y, =p+ (x +--:+x,), d'où l’équivalence 

Ti +:.+zrn Sn et x; 2 0 pour tout à 


Yi +. +yn <p+n et y; 2 1 pour tout 1. 


Les solutions de l’inéquation (2) sont donc en bijection avec les solutions de l’inéquation 


y+:-..+y, <p+n telles que y; > 1 pour tout . C’est une inéquation du type (1) (où n 


ren) 


est remplacé par p + n) : d’après (il, il y a donc ( » ) solutions à l’inéquation (2). 


Ainsi le nombre d'applications croissantes de {1,...,p} dans {0,...,n} est aussi (? + 

Puisque {0,...,n} possède n+1 éléments, le nombre d'applications croissantes de {1,...,p} 
p+(n-—1) 

dans {1,.:.4n) est | - À: = 

Exemples 


Les triplets (x,y,z) d’entiers tels que x >1, y>1,z22>1et x+y+2<5 sont: 
(1,1,3),(1,3,1),(3,1,1),(2,2,1),(2,1,2),(1,2,2) pour lesquels x + y +2=—5, 
(1,1,2),(1,2,1),(2,1,1) pour lesquels x + y + 2=4, 
et (1,1,1) pour lequel x + y + 2 = 8. 


__5x4 
or, = 10. 


- Les applications croissantes de {1,2,3} dans {1,2} sont : l'application c; constante 
de valeur 1, définie par «(1) = «(2) = (3) = 1; l'application « constante de 


Il y en a au total () 
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valeur 2; l'application c3 définie par c3(1) — c3(2) = 1 et c3(3) —2 ; et l'application 
ca définie par c1(1) = 1 et c1(2) = c1(3) = 2. Leur nombre est bien F7 = (:) = À. 


Corollaire. Soient n et p des entiers au moins égaux à 1. 


i L'équation x1 +--:+x, =n, où x; EN et x; > 1, possède ne, 


p—1 
a TrS . Fe à 1 ; 
ï) L'équation x; +--.+x, = n, où x; € N, possède Que ) solutions. 


) solutions. 


Démonstration. Si z:,..., +, Sont des entiers, on a l’équivalence 


Lit +z=n (ri +...+æ net m+-+m>n-1). 
Le nombre de solutions de l'équation %1 +---+%, =n, où x EN et x; 21, est donc 
(7) — (0) = (th De même, le nombre de solutions de l’équation æ1 +--:+x, =n, où 


p p p—1 

z; EN, est 4 - ist — une À = 
Exemple. Pour organiser un jeu publicitaire dans un centre commercial, on prépare 
p lots différents. En plus du lot, chaque gagnant se verra offrir au moins deux bons 
d'achat. On dispose de n bons d'achat, tous du même montant. Combien y a-t-il de 
façons de répartir tous les bons entre les lots ? 

Numérotons les lots de 1 à p et notons x; le nombre de bons d'achat donnés avec le 
lot numéro 1. Les bons étant tous les mêmes, une répartition est déterminée par les 
entiers %1,%2,...,%,. Puisque tous les bons sont utilisés, la somme des x; est égale 
à n. Le nombre cherché est donc le nombre de solutions (x1,...,x,) de l'équation 
Ti ++, = n telles que x; 2 2 pour tout 1. 

En posant y;=x;—2, l'équation +1+-:-+1,=n est équivalente à y +---+y,=n—2p, 
où les y; sont des entiers positifs ou nuls. Si n < 2p, il n’y a pas de solution. Si 


n > 2p, le nombre de solutions est PER ) — Fo 


Applications 


Nombre de rangements de n objets dans p boîtes 
Numérotons les boîtes de 1 à p et notons x; le nombre d'objets dans la i-ième 
boîte. En ne tenant compte que du nombre d'objets dans chaque boîte, les solutions 


sont les suites (71,...,æ,) d’entiers positifs ou nuls tels que x +:-:+x,=n. Le 
nombre de possibilités est donc (? à 


Combinaisons avec répétitions 

Étant donné un ensemble E à n éléments, une p-combinaison avec répétitions de ces 
n éléments est un ensemble à p éléments formé de clones d’éléments de E. 

Si par exemple E—{a,b,c,d,e, f}, alors a,a,c,d,d,d,f représente une 7-combinaison 
avec répétitions des 6 éléments de Æ. De même, u,u,u,v,v est une 5-combinaison 
avec répétitions des deux éléments u et v. 

Une p combinaison avec répétitions des n éléments a1,...,a, est déterminée par 
le nombre de fois qu'y figure chacun des élément a1,...,an : si ai est répété x 
fois, si a est répété x2 fois et ax, æx fois, alors &1 +2 +--: +2, = p. Il y a 
donc autant de p combinaisons avec répétitions de n éléments que de solutions 


64 - ENSEMBLES FINIS 


© Dunod -— La photocopie non autorisée est un délit. 


de l'équation 1 + %2 +---+ x, — p, où les x; sont entiers positifs ou nuls. Le 
jar) 
ne 


nombre de p combinaisons avec répétitions de n éléments est ( : 


C'est aussi le nombre de rangements de n objets dans p boîtes. 
Nombre de chemins sur un quadrillage 

Repérons les points du plan par leurs coordonnées dans un repère (O; à, j) et 

considérons le quadrillage formé des droites paral- 


lèles aux axes. Appelons chemin issu de O toute suite / 
P,=0O,P,...,Pn de points tels que, pour tout k, le 6 
vecteur P,P,,1 est égal à à ou à j. Les coordonnées 5 
des points P; sont donc des entiers positifs ou nuls. - F, 
La suite O, P,,...,P, définit une ligne brisée portée PP, 
par le quadrillage. | P 

0 


Un chemin issu de © est parfaitement déterminé 
quand on connaît, pour tout k, le nombre x4 de seg- 0123456789 
ments unité verticaux situés à l’abscisse K. 

Par exemple, le chemin de O à À représenté sur la figure correspond à la suite 


A1) Ti 0,x2 1,%3 2,%4 T5 0,%x6 2,%7 1,T8 0,9 2. 


Soit À le point de coordonnées (p,q), où p et q sont des entiers positifs ou nuls. 
Pour qu’un chemin issu de O ait le point À comme extrémité, il faut et il suffit que 
l'on ait xo+71+---+29 = q. Les chemins issus de © et d'extrémité À sont donc 
en bijection avec les solutions de l'équation 70 +:--+2,— q, où xx € N. D'après le 


corollaire précédent, il y a Lin =F . chemins issus de O et d'extrémité À. 


Applications ayant pour image leur ensemble d'arrivée 


Soient E et F des ensembles finis. Pour qu’il existe une application f : E — F telle 
que f(E) = F, il faut que le nombre d'éléments de Æ soit supérieur ou égal au 
nombre d'éléments de F' (voir page 58). 

Réciproquement, si l’on a |E|>|F|, il est facile de construire une application f:E—F 
telle que f(E) = F : par exemple, si E = {a1,...,ab}, F = {b1,...,b,} et p>n, on 
peut poser f(a;) = b; si 1<i<net f(a;) = bn sin <i<p. 

Supposons désormais |E| > |F| et comptons le nombre d'applications de E dans F 
dont l’image f(ÆE) est l’ensemble d'arrivée F' tout entier : 


une telle application permet de parcourir tous les éléments y = f(x) de 
l'ensemble d'arrivée en faisant varier x dans l'ensemble de départ. 


On dit que c’est une application surjective. 


Préliminaire. Si A est un ensemble fini non vide, il y a autant de parties de À ayant 
un nombre pair d'éléments que de parties de À ayant un nombre impair d'éléments. 


Démonstration. L'ensemble A étant par hypothèse non vide, on peut choisir un élément 
a € À. Posons B = A\{a}. Les parties de À qui ne contiennent pas a sont les parties de 
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B. Les parties de A contenant a sont de la forme Y = X U {a}, où X est une partie de B; 
puisque a & X, le nombre d'éléments de Y est 1+]X|. 

Notons p8 le nombre de parties de B ayant un nombre pair d'éléments et iz le nombre 
de parties de B ayant un nombre impair d'éléments. Une partie de A ayant un nombre pair 
d'éléments est ou bien une partie de B, ou bien de la forme X U{a}, où X est une partie 
de B ayant un nombre impair d'éléments. On en déduit qu’il y a ps +ir parties de À ayant 
un nombre pair d'éléments. De même, il y a ig +pg parties de À ayant un nombre impair 
d'éléments. Le résultat s'ensuit. î 


Si À est l’ensemble vide, la seule partie de À est A lui-même : il n'y a pas de parties 
de À ayant un nombre impair d'éléments et il y a une seule partie dont le nombre 
d'éléments est pair (en fait égal à 0). 


Proposition. Soient E un ensemble à p éléments et F un ensemble à n éléments, où 
p>n>0. Le nombre d'applications f : E — F telles que f(E) = F est 


a (Pen + (Jeune D) en + CE) 


On peut aussi calculer ces nombres de proche en proche : voir l'exercice 8 en fin de chapitre. 


Démonstration. Pour tout ensemble À, posons da = 3x 1 (—1)Xl, le signe D x<4 vou- 
lant dire que l’on effectue la sommation sur toutes les parties X de l’ensemble À. Si X est 
une partie de À, alors (—1) *l = 1 si le nombre d'éléments de X est pair et (—1)IX1 = 1 
si le nombre d'éléments de X est impair. D’après le résultat préliminaire, on a donc d1 = 0 
si À est non vide. Si À est l’ensemble vide, alors da = (—1)° = 1. Pour une application 
f:E—F, on a donc dp\f(p) = 1 si f(E) = F et dr\p(p) = 0 sinon. Notons $ l’ensemble 
des applications f : E — F telles que f(E) = F. En notant FF l’ensemble des applications 
de Æ dans F, nous venons de montrer que le nombre d'éléments de S est 
IS= > drum 2, > CD 
fre fEeFE XCF\F(E) 
Si f:ÆE — F est une application et si X est une partie de F', on a l’équivalence 
XCF\FE)S= f(E)CF\X. 
La seconde propriété signifie que f est une application de E dans F \ X. Il vient donc 
=> D Ce CyxIr\xr 
XCF fe(F\x)E XCF 
car ily a |[F\ X|? applications de E dans F\ X. Pour tout entier k tel que 0 <k<n, posons 
œ= D (IF\XP = (1 SC [FA XP, 

XCF XCF 

IX1=k IX1=# 
de sorte que l’on a [S]= Ye, 5x. Si X est une partie de F à k éléments, F \ X possède 
n—k éléments, et comme il y a (*) parties de F à k éléments, il vient s4 = (—1)*(#)(n—k)?. 


On en déduit S =} ocren (—-1)*(#)(n-—k)? qui est la formule annoncée. O 
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Exemple 

— Sur les 3! — 81 applications de {1,2,3,4} dans {1,2,3}, il y en a 3-3 x 21+3=— 
81 —3 x 16 +3 — 36 dont l’image est l’ensemble {1,2,3}. 

Si n —p, les applications f de E dans F telles que f(E) = F sont les bijections : 
on sait qu’il yen a n!. 


1.4 Probabilité binomiale et loi des grands nombres 


Supposons qu'au cours d'épreuves indépendantes, un événement se produit avec la 
probabilité p (p est un nombre réel tel que 0 < p < 1). 

Numérotons les épreuves de 1 à n et donnons-nous une partie À à k éléments 
de l’ensemble {1,2,...,n}. Pour que l'événement se produise exactement quand le 
numéro de l'épreuve est dans À, la probabilité est pË(1 — p)"-*. Comme il y a (5) 
parties à éléments, on en déduit que la probabilité pour que l'événement se produise 


exactement k fois en n épreuves est 
À 


P(E) = ()ea pp, 


Pour n et p fixés, les points de coordonnées 
(k, P(k)) se trouvent sur une courbe en forme 
de cloche. n=10,p=0,4 n—10,p=—0,8 
Par définition des probabilités P(k), on a bien 
sûr P(0)+P(1)+-::+P(n)=1, égalité qui n’est autre que l'identité [p+(1-—p)] “=, 
Notons X la variable aléatoire : nombre de fois que l'événement se produit en n 
épreuves. 


k k 


l'espérance. L'espérance de X est le nombre E—0P(0)+1P(1)+2P(2)+.-:+nP(n). 
Intuitivement, l'espérance est le nombre de succès auquel on peut s'attendre au cours 
des n épreuves. 

Puisqu’on a HUE ta il vient E=Y k(r}pf (ip fenpÿ (tip (pk, 


k=0 k=1 
n 


D'après la formule du binôme, on a Des nt p}°-#=[1+(1 pl" =1, d'où 
k=1 


E = np 


C'est pour l'entier k le plus proche de ÆE que P(k) est maximum (voir les courbes 
ci-dessus). 


nm 
La variance. La variance de X est le nombre V — SC — E)?P(k), autrement dit 
k=0 
l'espérance de la variable aléatoire (X — FE)? (carré de l'écart à l'espérance). Comme 
indice de dispersion des résultats, on choisit souvent l’écart-type o = VV. Montrons 
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que l’on a 
V =np(l—p) 


En utilisant l'identité k? = k(k —1)+k, il vient (k— np)? = k(k —1)+(1— 2np)k +n?p? 


et en posant s = >. k(k — 1)P(k), on obtient V=s+(1-—2np)E +n?p? =s+np-n?p°. 
k=2 ! 
Puisque k(k — 1)(7) = n(n — Ds on a s=n(n—1)p” ÿ pin pp} À; 
k=2 
comme la somme vaut [p + Gp)" * — 1 d’après la formule du binôme, on trouve 


finalement V = nn — 1)p? + np — n?p? = —np? + np = np(1 — p). 


Exemple. La désintégration d’une substance radioactive est régie par la loi sui- 
vante : s’il y a N atomes au départ, la probabilité pour que n d’entre eux se 
désintègrent pendant l'intervalle de temps [0,t] est (a — e7Xtjre-MN-R), où la 
constante de désintégration À est un nombre positif caractéristique de la substance. 
Il s’agit donc d’une loi binomiale de probabilité e ". 

Supposons qu’on a la probabilité c de détecter une désintégration (c dépend de 
la position du compteur par rapport au matériel radioactif). Sur n désintégrations 
produites, la probabilité d’en détecter k est (#)c*(1 — c)""#. 

Soit X la variable aléatoire : nombre de désintégrations observées pendant l'intervalle 
de temps [0,t]. La probabilité pour que ce nombre soit k est 


P(X _ k) _ >. Tel us e Atjre ANR) (er (il L ejrE 


n=k 
Comme on a () ) — () CE il vient 


P(X — k) _ ere - na L . on _ Ca à _ c)" kAt(n k)e AC(N-Kk) 


_ Cat .: e Xt}ke- AN) pr (Se 10 . e Myi(1 .: c)i(e*tyi 
(on a sorti de la somme des facteurs qui ne dépendent pas de n et l’on a fait le chan- 
gement d'indice i=n—Kk). En posant a = (1—e-*t)(1— cheft = —1+et+ c(1 — et), 
la somme s'écrit (formule du binôme) 


N-k 
D Mai = (1 + a) NE = [et + (1 — MNT, 


t 
. =0 
On a ainsi : 


P(X = k) = (je êl - eM)k(erAt)N—k [et + c(1 — et)] 
= (er(l _ e-t)#[1 — c(1 — e-Xt)] NE _ (P)ré(l —r)NE, 


où r=c(1—e-\), La variable aléatoire X suit donc une loi binomiale de probabilité 
r : pendant l'intervalle de temps [0,{], on peut espérer détecter E(t) = Nc(1— et) 


N-k 


désintégrations ; en mesurant un rapport E(t)/E(t:1), il est possible de calculer la 
constante de désintégration À caractéristique de la substance radioactive. 
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Si { est assez petit, alors 1 — et x Àt donc r ct; dans ce cas, tout se passe comme 
si la constante de désintégration était c\ et qu’on pouvait observer la totalité des 
désintégrations. 


La loi des grands nombres 

Répétons un grand nombre d'épreuves indépendantes pour un événement se pro- 
duisant avec la probabilité p. Pour un nombre d'épreuves n fixé, la fréquence 
d'apparition de l'événement est une variable aléatoire : si l'événement s’est produit 
k fois, sa fréquence est f, = k/n. 

Si € est un nombre entre 0 et 1, on note P{|f,-p| < €] la probabilité pour que f, 
soit comprise entre p — € et p+Ee. 

La loi des grands nombres affirme que 


P[lfa-p| <e] tend vers 1 quand n tend vers l'infini. 


Pour rendre plus précise cette affirmation, donnons-nous un nombre à entre 0 et 1 
et cherchons à partir de quelle valeur de n on aura l'inégalité P||f,-—p| <e] > 1—6. 


Par définition, la probabilité P[|f,—p|<e] est la somme a, — >. Len, 


Ik/n—pl<e 
En posant b, = + et — p}TT, il vient an + bn = 1. D'après la définition 
Ik/n—p|l2e 
de la variance, on a aussi np(1 — p) = V > ÿ 1k— npl?(%)p*(1- p)"-F; dans la 


Ik/n—pl>e 
somme, chaque facteur |k — np] = n|k/n — p| est supérieur ou égal à ne, donc 


np(1 — p) > n?e? >, (rt - pr F = nb, = n°e°(1— an). 
Ik/n—p|2e 
1 1- 1 

— n p) . Pour tout entier n supérieur à PU») on a pUp) < 6, 


7 
ne Ee? ne? 


On en déduit a, > 1 
donc ay > 1—6. 
Puisqu’on a 0 < p < 1, le produit p(1—p) ne peut dépasser 1/4 qui est le maximum 


de la fonction x(1—x) quand x parcourt l'intervalle [0,1]. Si l’on prend n > _. on 


-2 
p(1-p) de 
6e? 


aura aussi n > et par conséquent P[|f,-p| < €] > 1—6. 


1.5 Espérance et variance d'une variable aléatoire discrète 


Rappelons la définition générale de l'espérance et de la variance d’une variable 
aléatoire définie sur un ensemble fini d'événements. 


Définitions 
Soit Ÿ une variable aléatoire prenant les valeurs yi,yr,...,yn. Notons p; la pro- 
babilité pour que Y prenne la valeur y;, probabilité qu’on note aussi P(Y = y). 


— L'espérance de Y est le nombre E(Y) = D; yipi. 
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La variance de Y est l'espérance de la variable aléatoire Y —E (Y)] . c'est-à-dire 
le nombre V(Y) = 3% (y: —m)?p;, où m = E(Y). Le nombre 4/V(Y) est 
l'écart-type. 


Propriétés de l'espérance et de la variance. Soient Y et Z des variables aléa- 
toires prenant au plus un nombre fini de valeurs et soient a,b des nombres. 


 E(aY + bZ) = aE(Ÿ) +bE(Z) 
ïi} V(Y) = E(Y2) - [E(Y)| 
ï) V(aY + b) = a?V(Y). 


Démonstration. En notant ( l’ensemble des événements, l'espérance de Y est par définition 
E(Y) = Y ea Y (w)P(w), où P(w)est la probabilité de l'événement w. On a donc 

E(aY +bZ)= N° [aY(w) +bZ(w)|P(w)=a S Y(w)P(w)+bŸ Z(w)P(w)=aE(Y)+bE(Z) 

weEn wen weEn 

En posant m = E(Y), on a (Y —m)})? = Y?—2mY +m°? et en prenant l'espérance, il vient 
V(Y)=E[(Y -m)?] =E(Y?)-2mE(Y) +m°? = E(Y?)- m?, ce qui est l'égalité [ii]. Enfin, on 
a E(aY +b)=am+b et (aY +b)—E(aY +b)=a(Y —m), d'où V(aY +b)=E{(a?(Y —-m)?] = 
EI[(Y -m)?] = a2V(Y). oO 


Permutations 


Nous allons étudier plus précisément les transformations bijectives d’un ensemble fini. 


Définition 

Une transformation bijective d’un ensemble fini E s'appelle une permutation de E. 
On note «#(E) l’ensemble des permutations de ÆE et si n est un entier au moins 
égal à 2, on note 7, l’ensemble des permutations de {1,2,...,n}. L'ensemble 7, 
est un groupe de transformations appelé groupe des permutations. 


Nous avons montré page 60 que si E possède n éléments, alors le groupe «Ÿ(E) 
possède n! éléments. 

Pour étudier les permutations d’un ensemble Æ à n éléments, il suffit évidemment 
de considérer les permutations de l’ensemble {1,...,n}. Supposons donc désormais 
E={1,...,n}, où n>2, et commençons par étudier les permutations les plus simples. 


2.1 Les cycles 


Soient p un entier tel que 2<p<n et a1,a,...,a, des entiers deux à deux différents 
appartenant à l’ensemble E=—{1,...,n}. Définissons une permutation c de E en posant 


ta)=dui Hl<i<n-l, daj=u et dEl=RksikE lai, ah 
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Par définition, la transformation € permute circulairement les entiers a1,...,@ : 


Ci ar dk: Gi Ar 


et laisse fixe tous les autres entiers. 


Définitions 
La permutation c définie ci-dessus s’appelle un p-cycle et se note c=(a1 à2 --- Gp). 
L'ensemble {a1,...,a,} est le support du cycle c et l’entier p est la longueur du 


cycle. Un 2-cycle s'appelle une transposition. 


Exemples 1 


Soient a et b deux éléments différents de {1,2,...,n}. La transposition c = (a b) 


2=coc=idg. 


échange les entiers a et b en laissant fixes tous les autres entiers. On a c 
La transposition (b a) échange aussi les entiers a et b en laissant fixes les autres, 
donc on a (a b) = (b à). 

La permutation c=(3 2 5) est un 3-cycle de «# : il est défini par c(1)=1, c(2)=5, 
c(3)=2, c(4)—4, c(5)=3 et c(6)—6. Remarquons que l’on a aussi c—(2 5 3)=(5 3 2). 
Puisqu'on à O)=coc(i=r(2)=$5, )=0d5)=4, c(5)=c3)=2, là permutation 
c? est déterminée par 


1: 3m5m2R3 et (k) =k sikef{1,4,6}; 


cela montre que c? est le 3-cycle (3 5 2). 


On.a ass CD =bies, 'É)=d3)=2, Cbh=d)es et PR =r6 si 


k€ {1,4,6}, donc c — idg. Cette égalité s'écrit co c? = idg, donc il vient € ! = c?. 


Exemple 2. L'inverse du p-cycle (ai a --: a») est le p-cycle (ay ::: a2 &). 
Soit c— (ay a2 --- Gp) un p-cycle. Les itérés de a1 par c sont successivement 
Q2,...; dp, 41, @2,... et plus précisément, nous avons ci(ai) = a; pour 1I<i<p—1 


et (ai) = a. Si k est un entier compris entre 1 et p, alors ax = ck-l(a1), donc 
_ k—1 _ p+k-1 __  k-1 _  k-1 _ 
(ax) = oc (am) = € (a) = 0 oc(a) = € (a) = &. 
Aïnsi la permutation c? laisse fixe les entiers ax, et comme elle laisse fixe les autres 


entiers, on en déduit que c? est l'identité. Il s'ensuit «1 = © 1 = (a, +: a &). 


Proposition. Si c— (a; a ++: a,) est un p-cycle appartenant à 9, alors © = idg 
et p est le plus petit entier k > O tel que c* —idg. 


Composés de permutations 


Notation. Si s et s’ sont des permutations de E, la composée 505! se note simplement 


ss. 
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Exemple 3. Dans le groupe «#, posons s — (2 3 4) et s' — (1 2). La composée 
ss' est déterminée par 


1H 2-5 3 
ss’ ar et ss/(k) = k si k & {1,2,3,4} 
À > 4 Fr 2 < } } n M 
2-11 
On a donc ss = (1 3 42). 
Exemple 4. Soit c— (a; a --: a») un p-cycle appartenant à «9, et soit s une per- 
mutation de {1,2,...,n}. Montrons que la permutation sc(s-!) est égale au p-cycle 


(s(ai) s(a2) --+ s(ap)). 
La permutation c’ = sc(s7!) se déduit de c par le changement de référentiel s (page 
24). Elle est définie par les relations 
sil<i<p 


c'{sta)) =s(e(d)) = sa)  sii=p, 


donc c’ permute circulairement les entiers s(a1),s(a2),...,s(a,) et laisse fixe les autres. 


Remarque 

Soit s une permutation de E. L'opération qui transforme une permutation f de E en 
sfs-! est un changement de référentiel très utilisé dans les calculs. On a notamment 
la propriété suivante : 


si f et g sont des permutations de E, alors s(fg)s ! = (sfs !)(sgs |). 
En effet, on a (sfs-!)(sgs 1) = sf(s-ls)gs ! = sfidp gs! = s(fg)s”!. 


En général, pour calculer le composé ss/ de deux permutations, il faut tenir compte 
de l’ordre des facteurs : pour tout élément t, on obtient (ss')(4) = s0 s'(i) en trans- 
formant d’abord à par s', puis en appliquant s. Voici un cas important où l’ordre 
des facteurs n’a pas d'importance. 


Proposition. Si c; et c> sont des cycles dont les supports n'ont aucun élément en 
commun, alors C1C2 = C2C1. 


Démonstration. Posons €; = (ai a2 --: a,). D'après l'exemple 4, nous avons l'égalité 
CoC1 c = (co(a1) Co(@2) ... Ca(ap))- Par hypothèse, aucun des a; n’est dans le support de ©, 
donc c(a;)=a;. Il vient donc cc co = C1, d'Où C2C1 = C1c2 en composant à droite avec C2. M 


2.2 Décomposition en cycles 


Soit s une permutation de E — {1,2,...,n} et soit ao € E. 
Pour tout entier 20, posons a; =5"(a), de sorte que les itérés de ao sont &o,@1,a2,.... 
Puisque ces itérés appartiennent à l’ensemble fini {1,2,...,n}, on peut trouver deux 
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entiers à et j tels que a; = a; et à < j. Puisque a; = s'(ao) et a; — s/(ao), on a 
s(ao) = s/(ao), donc ap = 5 *(s/(ao)) = 7 *(ao) et j — à > 0. 

On en déduit qu’il existe un plus petit entier p > 0 tel que a, = ag. Si p — 1, alors 
s(ao) = à et & est un point fixe de s. 

Supposons p > 2. Les p premiers itérés de ao sont &o,&@1,...,49-1, et Comme on a 
ap = @o, il vient ap+i = 8° *# (ao) = s'(sP(ao)) = s°(ap) = 5 (ao) = a; pour tout entier 1. 
La suite ao,a1,a,... des itérés de a est donc périodique de période p. La permuta- 
tion s transforme les entiers ao,4&1,...,4,-1 en envoyant chacun des p — 1 premiers 
sur le suivant et en envoyant @p-1] SUT Gp — A0. Les entiers ap,..., ap-1 Sont donc 
transformés par s exactement comme par le p-cycle (ag ai -:: ap_1). 

Remarquons que si l’on itère ao par s-!, on obtient successivement Ap—1 + + > G1 0 : 
l'ensemble iter(a) = {ao,a1,...,a,_1} des itérés de a est donc aussi l’ensemble de 
tous les éléments s* (ap), où k parcourt Z. 


à |s(i 
Exemple. Soit s la permutation de {1,2,3,4,5,6,7,8,9,10} définie par 1 . 
le tableau ci-contre. 2 l6 
Dans les graphiques ci-dessous, les flèches permettent de visualiser les 
itérés d’un élément : | 8 
les itérés de 1 sont 1, s(1) = 3, s(3) — 8 et s(8) = 7; 1e 
les itérés de 2 sont : 2, s(2) — 6 et 5(6) — 4; 5 [5 
— les éléments 9 et 10 sont échangés ; 64 
on a 5(5) = 5, autrement dit 5 est un point fixe de 5. # | 4 
2 47 5 TT y Re 8 7 
Le. 7 tee 2, _4.,_ 6 9,10 9 l10 
cycle (1 3 8 7) cycle (2 6 4) transposition (9 10) 1019 


Reprenons le cas général d’une permutation s de E. Nous avons montré que l’ensemble 
des itérés d’un élément a € E est aussi iter(a) = {s*(a) | k € Z}. 

SibeE, on a l’équivalence b = s*(a) = a = s—"(b) : b est donc un itéré de a si et 
seulement si a est un itéré de b. Si b est un itéré de a, alors tout itéré de b est un itéré 
de a et réciproquement, donc les éléments a et b ont même ensemble d'itérés. 

On en déduit que si des ensembles iter(a) et iter(a’) ont en commun un élément x, 
alors ces ensembles sont égaux. En effet, x étant un itéré de a, on a iter(x) = iter(a), 
et de même on a iter(x) = iter(a’) ; il s'ensuit iter(a) = iter(a’). 

Les différents ensembles iter(a),iter(b),... sont donc des parties de Æ deux à deux 
disjointes et leur réunion est Æ. 


Rappelons ce que nous avons montré avant l'exemple : si un élément a possède q ité- 
rés, où q> 2, alors pour tout uEiter(a), on a iter(a)={u,s(u),...,51%-l(u)} et tous les 
éléments de iter(a) sont transformés par s selon le g-cycle c= (u s(u) -:: s7l{u)). 


Théorème. Soit s une permutation de E différente de l'identité. 


Il existe des cycles c,...,cm, dont les supports sont des parties deux à deux disjointes 
et tels que 8 = CiC2-: Cm. 
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Le plus petit entier r >0 tel que s" —id% est le ppcm des longueurs des cycles C1,...,Cm. 


Comme les supports des cycles c; sont des parties deux à deux disjointes, on peut 


composer ces cycles dans l’ordre qu’on veut (proposition page 72). 


k k .k 


Il s'ensuit que l’on a s* = c*ck...ck, pour tout entier k. 


Démonstration. Les éléments de E se répartissent en les parties C1 = iter(ai), C2 = 
iter(a2),...,Cn =iter(an) deux à deux disjointes. Quand on itère s, tous les éléments de C4 
décrivent un même cycle c; de support C%. Soit x € Cx. On a donc (x) =s(x) et cx(x) € Cx. 
Pour tout j £ k, ni x, ni c;(x) n’appartiennent à C;, donc c;(x) = x et c;cx(x) = (x). Il 
vient donc cic2---cn(x) = ck(x) = s(x). Cette égalité étant vraie pour tout x € C% et pour 
tout k, elle est vraie quel que soit x € E. 

Si x est un élément de C4, il revient au même d’itérer x par s ou par &, donc s"(x) = c,(x) 
pour tout entier r. Pour que l’on ait s”(x) = x quel que soit x € C4, il faut et il suffit que r soit 
multiple de la longueur de c;. Pour que l’on ait s”(x) = x quel que soit x € E, une condition 
nécessaire et suffisante est donc que r soit multiple du ppcm des longueurs des cycles cz. 


Exemple. La permutation s de l'exemple précédent se décompose en trois cycles : le 
4-cycle (1 3 8 7), le 3-cycle (2 6 4) et le 2-cycle (9 10). On a s—(1 3 8 7)(2 6 4)(9 10). 
Le plus petit entier r tel que s” = id est r = ppem(4, 3,2) = 12. 


Algorithme de décomposition en cycles 


Soit s une permutation de {1,2,...,n}. On suppose s différent de l'identité. L’algo- 
rithme suivant produit la liste L des cycles composant s. Un cycle (ao a1 --: a») 
est représenté par la liste [ao,... ,a,]. On commence par chercher le cycle décrit par 


les itérés de 1 en marquant chacun des entiers obtenus ; puis on cherche les itérés 
du plus petit entier non marqué et l’on continue ainsi jusqu'à ce que tous les entiers 
soient marqués. On calcule chaque fois le nombre £ d'itérés, car si l’on trouve un 
point fixe de s, on le supprime puisqu'il ne produit pas de cycle. 


initialisations : (L,C' + listes vides) (mli] = 0 pour tout à tel que 1 <i<n) 
les entiers marqués seront les entiers à tels que m(i) = 1. 
aju< min{i|1<i<n et mli =0}; 


b)C'< Cu (on ajoute u à la liste ©); mul 1; {4 l; ve s(u); 


c| tant que v £ u : 

C4 Cv (on ajoute v à la liste C); mu —1; lé L+l; ve s(v); 
d\si{>2, Le L,C (on ajoute la liste C' à la liste L); 
e) aller en a). 


À la fin de l'algorithme, on obtient une liste L de listes Ci,C2,... La permutation 
s est la composée des cycles représentés par les listes C;. 
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Groupe engendré par une permutation 


Soit s une permutation de l’ensemble E—{1,2,...,n}, différente de l'identité. Rappe- 
lons que l’ensemble T' = {s*|k€Z} est un groupe de transformations de E (page 28). 
D'après le théorème, il y a un plus petit entier r > 0 tel que s” = idg. Il s'ensuit que 
les transformations idp — s°,s,...,s"-l sont deux à deux différentes et que 845 = si 
pour tout entier j. On a donc simplement T = {idg,s,...,s"-l} et le groupe T 
possède r éléments. 

Soient s° et s/ des éléments de T, donc s°s7 — si*), En appelant k le reste de la divi- 
sion de +3 par r, il vient i+j=rq+k et sis = s"atk — (sr)ask — (idn)15* — sk, où 
k est compris entre 0 et r. Cela permet de calculer dans le groupe T'. On détermine 


r au moyen de la décomposition en cycles et du théorème précédent. 


Exemples 

- Pour la permutation s de l'exemple page 73, on a T' = {si |0 << 11} (avec la 
convention s° — idp). 

— Supposons que s est un p-cycle (ai a ...a,). Alors on a T' = {idg,s,-:-,sP"1}. 
Dans le groupe T engendré par s, les règles de calcul sont les mêmes que dans 
le groupe engendré par une rotation d'angle 27/p (exemple 3 page 28). 


2.3 Puissance d'un cycle 


Les permutations les plus utilisées en pratique sont les cycles. En particulier, on est 
souvent amené à étudier les puissances c* d’un cycle c. 
Rappelons que si p et q sont des entiers positifs, on a la relation 


ppem(p, q) x pgcd(p, q) = pq 


Proposition. Soient c un p-cycle et k un entier strictement positif et non multiple de p. 
Posons d= pgcd(p,k). La permutation c* est composée de d cycles, tous de même longueur 
p/d. Pour que c* soit un cycle, il faut et il suffit que p et k soient premiers entre eux. 


Démonstration. Posons c—(a as --- a,) et s=c*. Soit rE{ao.....a,}. Le cycle des itérés de x 
P P y 

par s a pour longueur le plus petit entier m>0 tel que s"*(x)=x, c'est-à-dire c*"(x)=x. Puisque 

c est un p-cycle, légalité c'(r)=x se produit si et seulement si à est multiple de p. On en déduit 


S"(x)=x = (x) = x > km est multiple de p 


<— km est multiple de p et de k 
<— km est multiple de ppem(p, k) = me 


<— m est multiple de : 


k 


Ainsi, lorsqu'on décompose c* en cycles, tous les cycles obtenus ont même longueur p/d; il 


k 


y a donc d cycles. Pour que c* soit un cycle, il faut et il suffit que d — 1, c’est-à-dire que p 


et k soient premiers entre eux. = 
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Exemples 
 Goit le 12-cyde c= (12345678 9 10 11 12). On a c= id, done = € 1, 


(13570 1)24681012 et fr) *! 
& = (147 10)(2 5 811)(36 912) et c° = (c) ! 
ct = (15 9)(2 6 10)(3 7 11)(4 8 12) et = (c{) ! 
S=(161149271251038) et c'—=(c) ! 
= (1 7)(2 8)(3 9)(4 10)(5 11)(6 12). 


Les entiers positifs compris entre 1 et 12 et premiers à 12 sont 1, 5, 7 et 11 : 

si Æ un entier compris entre 1 et 11, la permutation c* n’est un cycle que si 
k€ {1,5,7,11}. Si k est l’un des entiers 2, 3, 4, 6, 8, 9 ou 10, la permutation ck 
se décompose en deux, trois, quatre ou six cycles de longueur 6, 4, 3 ou 2. 

Soit p un nombre premier, c’est-à-dire que p est un entier au moins égal à 2 dont les 
seuls diviseurs positifs sont 1 et p. Si c est un p-cycle, alors pour tout entier k non 


multiple de p, ck est un p-cycle. En effet, 1 est le seul diviseur commun à p et k. 


2.4 Le rôle des transpositions 
Rappelons qu’une transposition est par définition un 2-cycle (a b). 


a) Si des éléments sont écrits dans un ordre, on peut en échanger deux quelconques par une 
succession d'échanges entre éléments consécutifs. 
Par exemple, pour échanger 1 et 4 dans la succession 1,2,3,4, nous pouvons 
effectuer les échanges suivants : 


ne TS ES 


DB Do) AIN 


3 


On a l'égalité (1 4) — (4 2)(4 3)(1 4)(1 3)(1 2) et dans cette composée, chaque 
transposition échange deux éléments qui étaient consécutifs. 


b) Tout cycle est un composé de transpositions. 
On a en effet l'égalité (a: a --- ap) = (ai a2)(a2 a3)---(ap-1 &p). 


Nous avons montré que toute permutation est une composée de cycles (l'identité 
étant égale à la composée TT, où T est une transposition quelconque). On en déduit : 


Proposition. Toute permutation est une composée de transpositions. 
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Puisqu’une transposition peut toujours se réaliser par échanges d'éléments consécu- 
tifs, il en va de même pour une permutation quelconque. Voici une méthode de tri 
fondée sur cette propriété. 


Le tri à bulles 

On dispose de données a1,a2,...,a, deux à deux comparables que l'on veut classer 
par exemple par ordre croissant; ces données peuvent être des nombres, ou encore 
des chaînes de caractères qu'on classera selon leur longueur. 

Notons a < b la propriété « a est plus petit ou égal à b ». Cette relation doit être une 
relation d'ordre, c’est-à-dire que l’on a : 


aka, (a<kbetb<c)—a<c, (a<betb<a) — a=b. 


Initialement, les données sont présentées en désordre dans une liste ou un tableau. 


Principe du tri à bulles. 11 consiste à parcourir la liste en commençant par la fin 
et en effectuant un échange à chaque fois que l’on trouve deux éléments successifs 
qui ne sont pas dans le bon ordre. 


Exemple. La liste à trier est [12,15,7,5,9, 2]. 
étape 1 é étape 3 


EN 


étape 1 : le nombre 2 étant le plus petit, il est successivement échangé avec tous 
les éléments de la liste. 

étape 2 : le nombre 5 est échangé successivement avec 7, 15 et 12 qui sont supérieurs. 

étape 3 : on échange 7 avec 15, puis avec 12. 

étape 4 : maintenant, 15 précède 9, donc on les échange, puis on échange 9 et 
l'élément 12 qui le précède. 

étape 5 : il n’y a plus d'échange possible, donc la liste est triée selon l’ordre croissant. 


Cet algorithme doit son nom au fait que les éléments «les plus légers remontent » vers 
le haut de la liste, comme des bulles de gaz dans un liquide. S'il y a n données à trier, 
le nombre d'échanges à effectuer est au maximum n—1 à la première étape, n—2 à la 
deuxième, etc ; le nombre maximum d'échanges est donc 1+4+2+::.:+(n—1)=n(n—1)/2. 
Puisqu’un échange a + b se réalise par une succession (c+ a),(a+ b),(b+ c) de 
trois affectations, il faut au plus 3n(n—1)/2 opérations pour trier n données. 
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Algorithme du tri à bulles 

initialisations : tableau de données Di] 1<4i<n à trier selon l’ordre croissant; 11; 
tant que à < n, faire : 
pour j de n à i+1:si D[j] < D]j —- 1], échanger D{j] et Dj —- 1); 
iii+i. 


3. Graphes 
Définitions 
Un graphe est la donnée d’un ensemble S$, fini et non vide, de sommets et d’un 
ensemble A d'arcs : un arc est une paire {a,b} de sommets. Si {a,b} est un arc, 
on dit que les sommets a et b sont adjacents ou joints par un arc et l’on note a,0 
ou b,a l'arc joignant ces sommets. 


On peut visualiser un graphe par un dessin : les sommets sont représentés par des 
points et si deux sommets sont adjacents, on les relie par une ligne. 


Ci-contre le graphe de sommets S = {a,b,c,d,e} ayant pour arcs / d 

ab, ac, bc, cd, de, ba. Les sommets b et c sont adjacents, & e 
de même que c et d, mais les sommets a et d ne le sont pas, figure 1 
cet e non plus. b 


Exemple. Les liaisons aériennes assurées par une compagnie définissent un graphe : 
les sommets représentent les villes desservies et deux sommets sont adjacents s’il y 
a une liaison entre les villes correspondantes. 


Le degré d’un sommet est le nombre d’arcs passant par ce sommet. Puisque chaque 
arc passe par exactement deux sommets, la somme des degrés vaut deux fois le 
nombre d’arcs. 


Définitions 

Soit G un graphe. 

— Un chemin est une suite 51,52,...,s, de sommets adjacents deux à deux différents ; 
le premier sommet est l’origine du chemin et le dernier est l'extrémité. 

Le graphe G est connexe si deux sommets différents peuvent toujours être reliés 
par un chemin. 

— Soit 51,52,...,S un chemin. Si n > 3 et si s, est adjacent à 51, on dit que 
(S1,S2,...,8n, S1) est un cycle. 


Exemple. Dans le graphe de la figure 1, (a,b,c,d,e) et (a,b,d,c) sont des chemins, 
(a, c, d,b, a) est un cycle; le graphe est connexe. 
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] Définition 


Un arbre est un graphe connexe qui n’a pas de cycle. À 


les arbres à six sommets 


Caractérisation d'un arbre. Soit G un graphe ayant n sommets. Les propriétés 
suivantes sont équivalentes : 


i) G est un arbre; 
ü) pour tous sommets a,b différents, il existe un unique chemin d'origine a et d'extrémité b; 
ï) G est connexe et possède n—1 arcs. 


Démonstration. 

Il suffit de raisonner dans le cas n > 3. Supposons que G est un arbre. Alors G est connexe 
donc entre deux sommets a et b différents, il existe au 
moins un chemin d’origine a et d’extrémité b ; supposons 
qu'il existe deux tels chemins Ci et C2; considérons le 
premier sommet « de C' qui est aussi sur C2 mais dont le 
successeur sur C, n’est pas sur C2 (u existe car C1 Z C2). 
Soit v le sommet suivant sur C1 qui soit aussi sur C2. Les 
parties de Ci et C2 entre w et v forment alors un cycle, contrairement à l’hypothèse que G 


est un arbre. 

Cela montre que (i) implique [ï}. Réciproquement, si G possède la propriété (ii), il est évidemment 
connexe et sans cycle. On a donc équivalence entre (i) et (ii). 

Pour démontrer que (i) implique (ii), raisonnons par récurrence sur le nombre de sommets. On 
peut trouver dans G un chemin 51,52,...,s, de longueur maximum. Supposons que a est 
un sommet adjacent à 5, ; si à était différent de tous les s;, on pourrait prolonger le chemin 
en ajoutant a; si a était l’un des sommets 51,...,5,_2, le graphe contiendrait un cycle; le 
seul sommet adjacent à s, est donc s,_1. En supprimant le sommet s, et l'arc s:_1,s,, on 
obtient un graphe G”’ ayant n—1 sommets et p—1 arcs, où p est le nombre d’arcs de G!. Le 
graphe G” n’a pas de cycle et est encore connexe, donc G” est un arbre. Par hypothèse de 
récurrence, G’ possède n—2 arcs, donc on a l'égalité p—1 = n—2, ou encore p = n—1. 

Il reste à montrer que [iüi) implique (i). On raisonne à nouveau par récurrence sur le nombre 
de sommets. Supposons que G est connexe et possède n — 1 arcs. Puisque G est connexe, les 
sommets ont des degrés d1,...,d, strictement positifs. L'égalité di + d2 +++ dy = 2(n—1) 
montre que les degrés ne peuvent pas être tous strictement supérieurs à 1, donc il existe au 
moins un sommet a de degré 1. En supprimant de G le sommet a et l'unique arc qui y 
passe, on obtient un graphe G” ayant n—1 sommets et n—2 arcs. Ce graphe G” est encore 
connexe, il a un arc de moins que le nombre de sommets, donc c’est un arbre, par hypothèse 
de récurrence. Un éventuel cycle de G doit passer par a, ce qui n’est pas possible car le degré 
de a est égal à 1. Le graphe G n’a donc pas de cycle. ü 


On a souvent besoin de pondérer les arcs : par exemple, si les arcs d’un graphe 
représentent des liaisons aériennes, on pourra attribuer à chaque arc le temps ou le 
coût de transport correspondant. 
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Définition 

Un graphe est pondéré si l’on a associé à chaque arc à,b un nombre réel w(a, b) 
appelé le poids de l'arc. Le poids d’un chemin, ou d’un graphe, est la somme des 
poids des arcs qui le composent. 


Nous allons présenter trois problèmes classiques et leur algorithme de résolution. 


3.1 Arbre de recouvrement de poids minimal 


Exemple. À partir d’une localité p, déjà raccordée au réseau du gaz, on veut 


alimenter les localités p2,p3,...,p6. Le plan de distri- 

bution doit minimiser la longueur de conduite à poser. pi | Do | p3 | pa | Ds 
Ci-contre le tableau des distances entre localités. 

Formons le graphe G de sommets 1,...,6 où deux 1314 

sommets quelconques sont toujours joints par un arc. ALaEdE 

L'arc joignant à et j est pondéré par la distance d; ; ‘ wl6l2l7 

des localités p; et p;. P5 

Un plan de distribution sera représenté par un sous- | P6 218 ps 


graphe T ayant les propriétés suivantes : 

a) T' doit contenir tous les sommets 1,2,...,6; 

b) T n’a pas de cycle et entre deux sommets, il doit exister un chemin : autrement 
dit, T' est un arbre; 

c) parmi les arbres ayant les propriétés précédentes, T' doit être de poids minimal. 

Un sous-graphe T ayant les propriétés (a) et (b) s'appelle un arbre de recouvrement de G. 

On va construire un arbre de recouvrement de poids minimal en sélectionnant au 

fur et à mesure ses sommets et ses arcs. 

1 Choisissons dans G un arc de poids minimal : l’arc 2,4, de poids 1, convient. 
Les sommets 2 et 4, avec l'arc qui les joint, forment un arbre T1. 

1} Considérons tous les arcs joignant l’un des sommets 2 ou 4 à un sommet qui n’est pas 
dans T°, c’est-à-dire les arcs Le 14 2. 3.4, 5,2, 5,4, 6,2 et 6,4. Les poids sont 


di,2 | dia | d32 | d3a | d59 | d54 | dé62 | d64 
5 7 4 8 6 7 5 4 


Parmi ces arcs, l'arc 3,2 est de poids minimal d3,9 = 4. On l’ajoute à T1 pour 
former l'arbre T> de sommets {2,4,3} ayant pour arcs 4,2 et 2,5. 

Ill) Recommençons comme à l'étape précédente : voici les poids des arcs joignant l’un 
des sommets de 7; à un sommet qui n’est pas dans 7, c'est-à-dire à 1, 5 ou 6 : 


di,2 | dis | dia | d5o | d53 | d54 | dée2 | d63 | d64 


3 3 


6) 3 1 6 2 7 5 6 4 
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Le poids minimal est obtenu pour l'arc 5,3 de poids 2 : en ajoutant cet arc à 7», 
on obtient l'arbre 7; qui a pour sommets 4,2,3,5. 
IV) Continuons de même : voici les poids des arcs joignant un sommet de T3 à l’un 
des sommets 1 ou 6 : 
di2 | di3 | dia | dis | dé | dés | d6a | dé,5 
si 3 7 10 5] 6 4 3 


Comme arc de poids minimal, choisissons l'arc T,3 de poids 3. En ajoutant cet 

arc à T:, on obtient l’arbre 7, de sommets 4,2,3,5,1. 
V) Il reste à sélectionner un arc de poids 

minimal parmi ceux qui joignent le som- 


. 4 
(2) 
met 6 à un autre. C’est l'arc 6,1, de à : : 
poids 2, qui convient : en l’ajoutant à 
Ti, on obtient un arbre T' solution : : : 
T2 T3 
4 4 


il contient tous les sommets et est de 
poids minimal 12. 


Dans cet exemple, nous aurions pu, en Il, choisir l’arc 4,6 ; cela aurait conduit à l’un 
des arbres T” ou T” différents de T' mais de même poids total 12. 


Construction d'un arbre de recouvrement de poids minimal 

Soit G un graphe pondéré connexe. En numérotant les sommets de G, on peut sup- 
poser que l’ensemble des sommets est P = {1,2,...,n}. Si à et j sont des sommets 
adjacents, notons d;; le poids de l'arc 3,1. Les sommets de l'arbre en construction 
seront placés dans un ensemble S et les arcs dans un ensemble À. Le symbole 
désigne un nombre strictement supérieur à tous les poids des arcs de G!. 


Étape 1. Sélectionner dans G un arc de poids minimal ; si cet arc joint les sommets 
a et b, on pose S={a,b} et A= {av}. 
Étape 2. Pour tout ie P\S, 


s'il existe un arc joignant à à un sommet de S, trouver un sommet k; € S tel 
que di,k, = min (di 5). Poser @ = di p,. 
JE 


s'il n'y a pas d’arc entre à et un sommet de $, poser @; = ©. 
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Étape 3. Trouver i* tel que a; — min (a;). Poser 
jeP\S 


Se SU{i} et A+ AU Ke}. 


Si l’ensemble S possède n éléments, alors l'arbre ayant pour arcs les éléments de 
A est un arbre de recouvrement de poids minimal et l'algorithme est terminé. 


Étape 4. Pour tout sommet i€ P\S adjacent dans G à i* et tel que d; ; <a;, poser 
Qi — dis et k; À 5 


puis retourner à l'étape 3. 


Remarque 

À l'étape 2, on a introduit le nombre a; dont la valeur est le plus petit poids d’un arc 
reliant le sommet ie P\S à l’un des sommets de S$. Cela permet de diminuer le nombre 
de comparaisons ultérieures entre poids. En effet, dans l'exemple précédent, la compa- 
raison entre les poids d1,2 et d1,4 se fait en (Il) : à l'issue de cette opération, on sait que le 
plus petit des deux poids est d1,2 ; en posant ai =d;2=5, il suffira, en {Ill}, de comparer 
les nombres di 3 et à ; la valeur k,—2 indique que c’est l’arc 1,2 qui a le plus petit des 
deux poids. On a de même k3=—2, a3=—d32—4, k5=—2, a5=d5,2—2, kç—4 et aç—d6 44. 
Quand on ajoute à S un nouveau sommet s, on peut être amené ensuite à considérer 


ges, 
un arc ?,s de poids inférieur à la valeur à; : c'est pourquoi, dans l'étape 4, on 
donne dans ce cas à à; la valeur d;., avant de retourner à l'étape 3. 


Exemples d'application. La recherche d’un arbre de recouvrement de poids 
minimal se rencontre dans de nombreux problèmes. Nous avons déjà mentionné l'or- 
ganisation d’un service de distribution (courrier, marchandises, information); voici 
deux autres exemples. 


En Biologie, on cherche à construire des arbres phylogéniques : ces arbres décrivent 
les relations de parenté entre les organismes d'un groupe sélectionné et permettent 
de faire des hypothèses en théorie de l’évolution. 

On choisit un ensemble de caractères morphologiques ou génétiques et l’on forme 
un graphe pondéré : les sommets représentent les organismes considérés et le 
poids d’un arc entre deux organismes reflète l'écart entre leurs caractères, par 
exemple au moyen d’un indice fondé sur la fréquence et la stabilité de certaines 
mutations génétiques. Si l’on suppose que l’évolution des organismes se fait le 
plus probablement au moindre coût génétique, alors un arbre de recouvrement de 
poids minimal renseigne sur l’ordre dans lequel les mutations ont pu se produire. 

La Robotique conçoit des automates électro-mécaniques programmables pour des 
tâches spécifiques. Leur fonctionnement se modélise aisément par un graphe : un 
sommet représente un état de l’automate et un arc est une transition directe entre 
deux états. Pour pondérer les arcs, on peut utiliser par exemple la durée de la 
transition ou l'énergie consommée. 
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Une bonne programmation de l’automate doit lui permettre de passer au moindre 
coût d’un état quelconque à un autre. Chaque arbre de recouvrement de poids 
minimal apporte donc une réponse raisonnable à cette demande d'optimisation. 


3.2 Chemin de poids minimum d'un sommet à un autre 


Dans un graphe où la pondération des arcs représente par exemple des distances 
ou des durées d'exécution de tâches, il est naturel de chercher les chemins les plus 
courts possibles entre sommets. 


Par exemple, en Linguistique, on définit des notions de proximité lexicale entre langues 
d’un groupe donné. Si l’on forme un graphe dont les sommets représentent les langues 
considérées et dont les arcs sont pondérés par la proximité, un chemin de poids minimal 
entre deux sommets décrit les étapes d’une influence linguistique possible. 


Exemple. Voici une table des temps de transport routier entre cinq localités 
A,B,C,D,E (l'unité est le quart d’heure); la durée d’un trajet n’est pas forcément 
le même dans un sens ou dans l’autre (à cause de la topographie, par exemple); le 
signe © indique qu'il n’y a pas de liaison directe entre les localités. 


A0 4)1/|6 
B|5 0 3|61]2 
C11 0) 4)4 
Do 2110 09 
El1131710 


Représentons ces données par un graphe à cinq sommets correspondant aux localités 
A,B,C,D,E ; pour simplifier, nous numérotons dans cet ordre les sommets de 1 à 5. 
Pour chaque paire de sommets à, j, il y a un arc muni de deux poids : le poids d(à, 5) 
est le temps de transport de à vers j et le poids d(j,i) est le temps de transport de 
j vers à; on donne au signe œ une très grande valeur, par exemple 1000. 
Formons le tableau 


0 4 1 1000 6 
5 03 6 2 

D! = 1 10 4 4 
1000 210 0 9 

1 13 7 O0 


Si à et j sont des entiers entre 1 et 5, on note D}; le nombre situé à l'intersection 
de la i-ième ligne et de la j-ième colonne. Par exemple, D} 4 = 6. 

On va aussi utiliser des tableaux P à cinq lignes et cinq colonnes : le nombre PF; ;, 
situé à l'intersection de la i-ième ligne et de la j-ième colonne de P, sera le numéro 
du sommet qui suit le sommet à dans un plus court chemin de à vers j déjà découvert. 
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Initialement, on choisit simplement le chemin (i,j) comme plus court chemin; en 
notant P° le premier tableau, on a donc P}, = j et 


Fl= 


Be HE Hi 


23 
2 3 
2 3 
2 3 
2 3 


rer 
OT O1 O1 O1 Ct 


Mais pour aller par exemple de 5 à 3, il vaut mieux passer par le sommet 1, car on 
a D}; + DY3 =1+1<3— D 3. On va systématiquement comparer la durée d’un 
trajet direct à celle d’un trajet passant par le sommet 1. 


1) Formons un tableau D! contenant les durées des plus courts chemins passant 


éventuellement par le sommet 1. On pose donc 


nn DYi+D?, si D, +D?,< D}, 
É DŸ, sinon 
Si l’on a trouvé que le chemin (i,1,j) est plus rapide que (4,5), il faut modifier 
le tableau P en posant P;; = 1. On définit donc un tableau P! tel que 
Pi b{is Df,+D?,;< D}, 
: j sinon 
Nous avons remarqué que le chemin (5,1,3) a un poids 2 inférieur au poids de 


(5,3), donc on pose D}; = 2 et Pi; = 1. On vérifie qu'aucun autre chemin ne 
peut être raccourci en passant par le sommet 1. Il vient donc 


0 4 1 1000 6 12345 

5 0 3 6 >| 12345 

D'=| 1 10 4 4 P'=|12345 
1000 2 10 0 1 12345 

1 12 7 0 12145 


I} On cherche maintenant le plus court chemin de à vers j passant éventuellement 
par les sommets 1 et 2. Pour cela, on recommence les opérations précédentes en 
comparant D}; et D} + D}; et en retenant le chemin le plus court. Voici les 
améliorations possibles : 


D 3 + Dia =4+6 = 10 < 1000 = D\, 
Dis+Di1=2+5= 7 <1000= D, 
Dis+Dis=1+2=8 < 4 =D;; 
Dis+Di1=2+5= 7 <1000= D, 
Dig+Dia=2+38= 5 < 10 =D; 
Dis+Dis=2+2=4< 9 =D}, 
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On pose donc 


041106 12325 
503 6 2 12345 
D'=|11043 P=|12342 
T9 50 d 048 
11270 12145 


Il) On compare maintenant D? j D?, + Di ;- On a 


D 3+Di2a=1+1=2< 4 = Di; 
D 3+ Dia=1+4=5<10= D, 
Di3+Di1=3+1=4< 5 =D: 
Di3+Di=5+1=6< 7 =D; 
Dé 3 + Dia=2+4=6<7 =D, 


et D?3 + D, > D? ; dans les autres cas, donc 

02154 13333 

40362 32345 

D°=|11043 Fe l12349 

62504 22242 

11260 12115 

IV) Regardons si on peut raccourcir les chemins en les faisant passer par le sommet 

4. On a Dÿ, + D}, > D}; pour tous #,j, donc 


D=DŸ et  P{=— P*. 


V)Il reste à considérer le passage éventuel par le sommet 5. On a 


Dis+ Dé =2+1=3<4=D;; 
Di5 + Dé =4+1=5<6= D; 


et Di, + D; > D; ; dans les autres cas, d’où 


02154 13383 
3:0 3.6 2 52345 | 
D°=|11043 PS=|12342|. 
52504 Hi 
1260 12115 


Dans le tableau D”, le nombre D}; est la durée d’un plus court chemin de à vers 
j. Pour trouver un tel chemin, on utilise le tableau P°, car PR? est le sommet qui 
suit à dans un plus court chemin de à vers j. 

Cherchons par exemple un plus court chemin de 4 vers 3 : on a P}4 = 2 donc le 
chemin commence par les sommets 4,2 ; le sommet suivant est P>;—3, donc (4,2,3) 


est un plus court chemin pour aller de 4 vers 3 ; sa durée est D? 3 = 5. 
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s 


De même, pour trouver un plus court chemin allant de 1 à 5, on observe que 
Pÿs — 3, donc le chemin commence par 1,3; les sommets suivants sont Pÿ; = 2, 
puis P; = 5; il s’agit donc du chemin (1,3,2,5) de poids D, = 


Algorithme de recherche d'un chemin de poids minimum 
On numérote de 1 à n les sommets du graphe et l’on suppose que pour chaque arc 
3,7, on a défini un poids d;,; pour le chemin (i,j) et un poids d;; pour le chemin 
(j,4). S'il n’y a pas d’arc entre les sommets 4 et j, on définit ces nombres en leur 
donnant une valeur très grande par rapport aux poids. 
Étape 1. On construit les tableaux D et P à n lignes et n colonnes en posant D, j= 
di,; et Pi; = pour 1<i<n et 1<j<n (i est l'indice de la ligne, j celui de la colonne). 
Étape 2. Pour k de 1 à n, exécuter la tâche suivante : 
pour à de 1 à n, pour j de 1 à n, 
Si Dix + Dr; < D;,, alors (br; — Dir+Dr; et P;+ Pie 
Après exécution de cet algorithme, D; ; est le poids minimum d’un chemin de à vers 
j. Les sommets successifs d’un tel chemin sont ÿ,i1 = P;,;,i9 = P,, ;, etc. Mis à part 
le point de départ à, ces sommets se lisent en parcourant dans un ordre convenable 
la j-ième colonne de P. 


3.3 Le problème du flot maximum 


Exemple. À partir d’une station de pompage située en s, un réseau de conduites per- 
met d’acheminer du pétrole en des lieux a, b, c, d'et t. Ci-dessous le plan du réseau. 
La flèche indique le sens d'écoulement dans chaque conduite et le chiffre entre 
parenthèses indique la capacité de la conduite, 


@ (4) b 
c'est-à-dire le débit maximum, en barils par heure. @ @ 
On obtient un graphe dont les arcs représentent 
les conduites. Mais chaque arc possède une ori- s t 
gine et une extrémité, donc nous désignons les 
arcs d les : (@ (a) 

par des couples : (s,a), (s,c), (c,a), (a,b), 
ë 2) d 


(c,d), (cb), (b,d), (b,t) et (d,t). 

Le graphe est dit orienté. figure 1 

On veut faire transiter de s à t le plus de pétrole possible en réglant convenablement 
le débit dans chaque conduite. Un régime d’écoulement est déterminé par 


- le débit F assuré par la station de pompage s, 
— la capacité de chaque conduite (u,v) 
la quantité de pétrole f(u,v) qui transite en une heure dans la conduite (u, v). 


La quantité pompée en s étant d’abord envoyée vers a et con a 


(sa) +f(s,c) = F 
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En un point donné du réseau, il y a toujours autant de pétrole qui arrive que de 
pétrole qui part : cette loi de conservation se traduit par 


J{s,a) + f(ca)= f(a,b), f(s,c) = f(c,a) + f(c,b) + f(c, d) 
f(a,b)+ f(cb) = f(6,d) + (6,0, f(d,t) = f(c,d) + f(b, d) 
et puisque tout le pétrole arrive en t, on aura aussi 
FO) +f(dt)=F 
Il s’agit de trouver les flux f(u,v) pour que F soit maximum, sachant que, dans 


chaque conduite, le flux ne peut excéder la capacité. Voici la formulation du problème : 
Trouver les f(u,v) rendant F maximum, sachant que l’on a 


f(s,a) + f(s,c) = f(b,t) + f(d,t)=F 
f(s,a) + f(c, a) — f(a,b) = 0 
f(s,c) — f(c, a) — f(c,b) — f(c,d) = 0 
f(a,b) + f(c,b) — f(b,d) — f(b,t) = 0 
f(c, d) + f(b,d) — f(d,t) — 0 
O< f(s,a) <3,0< f(a,b) <A4, 0 < F(b,t) < 3 
O< f(s,c) <4,0< f(c,d) <2,0< f(d,t) <4 
O<f(ca)<5,0< (cb) <1,0< f(b,d) <1 


Énoncé du problème général 

Soit G un graphe orienté et connexe. 

> On suppose qu'il existe un unique sommet s, appelé source, où n'arrive aucun arc 
et qu'il existe un unique sommet {, appelé terminal, d'où ne part aucun arc. 

- À chaque arc (u,v) est associé un nombre c(u,v) > 0, appelé capacité de l'arc; s’il 
n'y a pas d’arc entre deux sommets w et v, on pose c(u,v) = 0. 

— Un flot est la donnée pour chaque arc (u,v) d’un nombre f(u,v) > 0 satisfaisant 
les conditions : 
il f(u,v) < c(u,v) pour tout arc (u,v). 
ï) Si a est un sommet différent de s et de £, alors D (ua) (UV: 4) = are (ayu) J (@» U)- 
La condition (ii) exprime la loi de conservation : en tout sommet différent de la 
source et du terminal, le flux entrant est égal au flux sortant. 

— La valeur d'un flot f est la quantité val(f)= 5", (,,, /(s,u), somme des flux issus de 
la source. Il résulte de la loi de conservation que l’on a aussi val(f)=5 a (9 f(v,t). 

La valeur d’un flot ne peut pas excéder la somme des capacités des arcs aboutissant 

au terminal, ni celle des arcs issus de la source. 

Problème : trouver sur G un flot dont la valeur est la plus grande possible. 

Un tel flot s'appelle un flot maximum. 


La recherche d’un flot maximum se rencontre dans la plupart des questions relatives 
aux réseaux de distribution, notamment en télécommunication. 
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Exemple. Reprenons le graphe de l'exemple présenté en introduction. Sur la figure 
suivante, nous indiquons à coté de chaque arc un couple capacité, flux : pour l'arc 
(s,a), on a ainsi c(s,a) = 3 et f(s,a) = 2. C'est un exemple de flot; sa valeur est 


val(f) = f(s,a) + f(s,b) = 4 = f(b,t) + f(d,t). 


a (4,2) b 


€ (2,1) d 


Procédé d'augmentation d'un flot 

Supposons que f est un flot (par exemple f(u,v) = 0 pour tout arc (u,v)). 
Rappelons qu’un chemin de G est une suite de sommets adjacents deux à deux dif- 
férents. Dans un chemin de G, il y a en général des arcs parcourus dans le sens de 
leur orientation et des arcs parcourus dans l’autre sens ; les premiers sont dits directs, 
les autres sont indirects. Par exemple, dans le cas du graphe de la figure 1, le chemin 
(s,a,b,c,d,t) a pour arcs directs (s,a), (a,b), (c,d) et (d,t) et l’arc (c,b) est indirect. 
Supposons que 7 est un chemin de s vers { dont tous les arcs sont directs et vérifient 
flu,v) < c(u,v). Si p est le minimum des différences c{u,v) — f(u,v) le long de +, 
on peut augmenter le flot de la valeur p sur tous les arcs du chemin, car la loi de 
conservation sera encore satisfaite après cette opération. 

Par exemple, sur la figure 2, on peut augmenter le flot de 1 le long du chemin 
(s,c, a, b, d,t) ; le résultat est montré figure 3. 


a (4,3) b 


figure 3 


€ (2,1) d 


Plus généralement, nous dirons qu’un chemin est non saturé si l’on a f(u,v) < c(u,v) 
pour tous les arcs directs et f(u,v) > 0 pour tous les arcs indirects. 
Supposons que 7 est un chemin non saturé de 5 vers t. Pour tout arc à de +, on pose 


__ fc(a)— f(a) si a est direct 
= { f(a) si à est indirect. 
On définit 
p()= min {p(a)} 


arc à de + 
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qui est un nombre strictement positif puisque 7 est non saturé. Pour chaque arc du 
graphe, on pose 

Î(a) = f(a) + p(y) si a est un arc direct de y 

f(a) = f(a) — pr) si a est un arc indirect de y 
f(a) si a n’est pas un arc de 7. 


On vérifie facilement que f est encore un flot et que l’on a val(f) — val(f) + p(). 
Puisque p(7) est strictement positif, on a val(f) > val(f). 
Pour le flot f de la figure 3, le chemin 7=(s,a,b,c,d,t) est non saturé : en effet, sur 


les arcs directs, le flot est strictement inférieur à la capacité et sur l’arc indirect (c,b), 


le flot est strictement positif. On a p(s,a) = p(a,b) = p(c,b) = p(c, d) = 1, p(d,t) —2, 


donc p(7) = 1. On peut donc augmenter le flot de 1 sur les arcs directs (s,a), (a,b), 
(c,d) et (d,t) et le diminuer de 1 sur (c,b) : on obtient le flot f de la figure 4. 


a (4,4) b 


figure 4 


Recherche de chemins non saturés 
Pour chercher des chemins non saturés, on utilise un procédé de marquage successif 
des sommets du graphe. Voici la règle du marquage. 
La source s reçoit pour marque (—,00), où le signe œ représente un nombre très 
grand par rapport aux capacités des arcs du graphe. 
Supposons que le sommet u a été marqué et que v est un sommet non marqué 
adjacent à u. 
marquage en avant : si l’arc orienté est (u,v) et si f(u,v) < c(u,v), on donne à 
v la marque (u*,p,), où p, = min {p4,c(u,v) — f(u,v)}. 
marquage en arrière : si l'arc orienté est (v,u) et si f(v,u) > 0, on donne à vw 


la marque (u ,p,), où p, — min {p, f(v,u)}. 


Quand un sommet v a été marqué, on peut remonter jusqu'à la source les prédéces- 
seurs de v dans le marquage : en effet, si la marque de v contient u* ou u, c'est que 
le marquage de u a immédiatement précédé celui de v. Cela détermine un chemin 
(S = op, @1,Q2,..., ax = v) Où 4;}1 a été marqué à partir de a;. Par construction, la 
marque p, est strictement positive. Si v=t, on a obtenu un chemin non saturé de s à t. 
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Méthode de recherche d'un flot maximum 

Dans une première phase, on marque les sommets successivement en partant de la 

source s. Cette phase se termine lorsque le terminal t reçoit une marque ou bien 

lorsqu'aucun sommet ne peut plus recevoir de marque. 

Si t a été marqué, on a trouvé un chemin 7 non saturé de s à t : 

- on augmente alors le flot de la quantité p(7), minimum des marques p,, où v 
parcourt les sommets de 7 : on a donc simplement p(7) = ps. 

On supprime ensuite toutes les marques sauf celle de s, puis on recommence le 
marquage. 

S'il n’y a plus de sommet à marquer et si { n’a pas été marqué, le flot est maxi- 
mum, du moins dans le cas où les capacités ont des valeurs entières : dans ce cas 
en effet, le flot augmente, à partir du flot nul, par valeurs entières, donc la valeur 
des flots successifs finit par être stationnaire. 


Algorithme du flot maximum. On suppose que les capacités sont des entiers 
positifs ou nuls. 


) Trouver un flot dans le graphe G (on peut prendre f(a) = 0 pour tout arc à) et 
donner à s la marque (—, co). 


1) Marquer les sommets successivement jusqu'à ce que { soit marqué ou bien qu'il 
n'y ait plus de sommet marquable. Si t est marqué, aller en {Ill}; sinon aller en (V). 


Ill) Poser v = t et p = p4. Tant que v £ s faire : 
si la marque de v contient u*, alors f(u,v) <— f(u,v) +p; 
ü) si la marque de v contient « , alors f(v,u) «— f(v,u) —p; 
ii) U <— U. 

IV) Supprimer toutes les marques sauf celle de s et aller en (Il). 


V) Fin de l'algorithme : le flot est maximum. 


s 


Exemple. Appliquons l'algorithme à l'exemple précédent. Le graphe est celui de 
la figure 1 reproduite ci-dessous 


a (4,0) b 
(3,0) (3,0) 
8 t 
(4,0) (4,0 
€ (2,0) d 


On marque la source s par (—,%) et l’on part du flot nul. 


a) On peut marquer successivement les sommets c, a, b et t (phase Il) : 
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marquage de c à partir de s : la capacité de (s,c) est 4 et f(s,c) = 0, donc 
pe = min{oo,4 — 0} = 4 et c reçoit la marque (s*,4); 


marquage de a à partir de c : la capacité de (c,a) est 5, f(c,a) =0, donc 
Pa = Min{pe, 5 — 0} = 4 et a reçoit la marque (c',4); 


marquage de b à partir de a : p, = min{p,,c(a,b) — f(a,b)} = 4, donc b reçoit 
la marque (a*,4) ; 

marquage de t à partir de b : on a p; = min{ps,c(b,t) — f(b,t)} = min{4,3} —3 
donc { reçoit la marque (b*,3). 

Augmentons le flot de la quantité p; = 3 sur le chemin (5,c,a,b,t) : il vient 

F(b,t) = f(a,b) = f(c,a) = f(s,c) =3 (phase ID et supprimons toutes les marques 

sauf celle de s. On a obtenu le flot de la figure 5. 


a (4,3)  b 


figure 5 


€ (2,0) d 


b) Marquons successivement les sommets c, b, d, t. 
marquage de c : la capacité de (s,c) est 4, donc p. = min{æw,4} = 4 et c est 
marqué (s*,4); 
marquage de b à partir de c : la capacité de (c,b) est 1, donc p, =min{p.,1}=1 
et b est marqué (c*,1); 
marquage de d à partir de b : la capacité de (b,d) est 1, donc p;=min{p;,.1}=1, 


et d est marqué (b*,1); 
marquage de t à partir de d : la capacité de (d,t) est 4, donc p; =min{pa,4} =1 
et t est marqué (d*,1). 
On augmente le flot de 1 sur le chemin (s,c,b,d,t), en posant f(d,t) — f(b,d) — 
f(c,b) = 1 et f(s,c) = 3 +1 = 4 puis on supprime toutes les marques sauf celle 
de s. Le flot obtenu est montré figure 6. 


a (4,3) b 


figure 6 
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c] Sur l'arc (s,c), le flot est égal à la capacité, donc on ne peut pas marquer c à 
partir de s. 


Le sommet a est marquable : p, = c(s,a) — f(s,a) = 3, donc a reçoit la marque 
(s*,3). On peut alors marquer b, mais ensuite ni d ni t ne sont marquables, 
car sur les arcs (b,d) et (b,t), le flot est égal à la capacité. 

— À partir de a, on peut marquer € (marquage en arrière), car le flot de c vers 
a est positif. On obtient p. = min{p,,3} = 3 et c reçoit la marque (a ,3). 

> On peut maintenant marquer successivement d et # : le sommet d est marqué 
(c*,2) et pour t, on a p; = min{p, c(d,t) — f(d,t)} = min{2,4 — 1} = 2, donc 
la marque de t est (d*,2). 

Le chemin parcouru au cours du marquage est (s,a,c,d,t); sur les arcs directs 

(d,t), (c,d) et (s,a), on augmente le flot de p; = 2 et sur l’arc indirect (c,a), on 

diminue le flot de 2. On obtient le flot figure 7. 


a (4,3) b 


figure 7 


€ (2,2) d 


d)Sur l'arc (s,c), le flot est égal à la capacité, donc on ne peut pas marquer € à 
partir de s. Le sommet a peut être marqué, car c(s,a) — f(c,a) =3—2=1 > 0. 
On peut aussi marquer b et c à partir de a. Mais sur les arcs (b,t), (b,d) et (c,d), 
le flot est égal à la capacité : il sera donc impossible de marquer t. Les phases II, 
III, IV de l'algorithme sont exécutées, donc le flot obtenu est maximum (figure 7). 
La valeur du flot maximum est val(f) = f(s,a) + f(s,c) =2+4— 6. 


En faisant d’autres choix pour les marquages, on peut obtenir d’autres flots maximum 
de même valeur, comme ceux de la figure 8. 


a (4,3) b 
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Flot maximum et coupure minimum 


Revenons au problème général et formulons quelques définitions. 

Une coupure de G est une partition de l’ensemble des sommets en deux parties 5,5” 
telles que s€ Set te S'; les parties S et S’ sont donc disjointes et leur réunion 
est l’ensemble de tous les sommets. 


La capacité d’une coupure (5, L est le nombre C(S, S") — 5 c(u,u), 


1 arc (u,u') 

- son flot est le nombre F(S,S") ) f(u,u!) eo 
arc (u,u’) 
uesS , u'eS" 


On définit de même le nombre F(S",S). 


Exemple. Pour l’un des flots représentés figure 8, prenons comme coupure 
S=f{s,a,b,c} et S'={d,t}. Les arcs orientés ayant leur origine dans S et leur extré- 
mité dans S’ sont (c,d), (b,d) et (b,t), donc la capacité est C(S,S')=2+1+3—6; 
le flot de cette coupure est aussi F(S,S") =2+1+3—6 et l’on a F(S",S) = 0, car 
il n’y a aucun arc d’origine d ou t ayant son extrémité dans S. 
Proposition. Pour tout flot f et pour toute coupure (S,S'), on a 

val(f) = F(S,S") — F(S",S). 


Démonstration. Pour tout sommet u € S, on a 


val(f) siu=s 
ECO CC ES PE PEr 
car f est un flot. En ajoutant ces égalités pour les différents sommets de S, il vient 
DE - EX = vin. 
ueS v uES v 


Si u et v sont deux sommets de 5, les termes f(u,v) et —f(u,v) apparaissent exactement 
une fois dans chaque somme, donc se détruisent. Après simplification, on obtient l'égalité 


>. >. fCu,v) - S° ». f(v,u) = val(f), 


uES vES’ uES ves! 


c'est-à-dire F(S,S") — F(S',5) = val(f). ü 


Corollaire. Soient f un flot et (S,S') une coupure de G!. 
i) On a val(f) < F(S, 5"). 
ü] Si val(f) = C(S,S"), alors le flot f est maximum et (S,S") est une coupure de capacité 
minimum. 
Démonstration. On a val(f) =F(S,S')—F(5",5) < F(S,S'), car F(S’,5) > 0. Soit f* un 
flot maximum et (S*,S'*) une coupure de capacité minimum. D’après (il, on a 
val(f*) < F(S*,S"*) < C(S*,S"*), d'où 
val(f) < val(f*) < C(S*, 57) < C(S,87). 
Supposons val(f) = C'(S,S’). Il s'ensuit val(f) = val(f*) = C(S*, S’*) = C(S,S"), donc f est 


un flot maximum et (S,S’) est une coupure de capacité minimum. a 
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s 


Pour justifier l'algorithme, il reste à montrer que si un flot à capacités entières ne 
présente pas de chemin non saturé de s à t, alors ce flot est maximum. 


Proposition. Un flot à capacités entières est maximum si et seulement s'il n'y a pas de 
chemin non saturé de s à t. 


Démonstration. S'il y a un chemin non saturé de s à { pour le flot f, le procédé d’aug- 
mentation conduit à un flot f* de valeur strictement supérieure : le flot f n’est donc pas 
maximum. Réciproquement, supposons que pour le flot f, il n’y a pas de chemin non saturé 
de s à £. Soit S l’ensemble des sommets qu’on peut atteindre à partir de s par un chemin non 
saturé. On a s€ 5, et par hypothèse { # S. En notant S’ l’ensemble des sommets qui ne sont 
pas dans $, on définit donc une coupure ($,S"). Soit (u,v) un arc tel que ue Set ve S". 
Par définition de S, il existe un chemin 7 non saturé de s à u. Si l’on ajoute l’arc (u,v) à 
ce chemin, on obtient un chemin saturé, car v g S. On a donc f(u,v) = c{u,v). De même, si 
(w,z) est un arc tel que we S'etzEeS,ona f(w,z) = 0. Il s'ensuit F(S,5") = C(S,S") et 
F(S",S)=0. Par suite val(f) = F(S,S") — F(S",5) = C(S,S"). D'après le corollaire précédent, 
f est un flot maximum et (S,S’) est une coupure de capacité minimum. al 


Puisque l'algorithme se termine lorsqu'il n’y a plus de chemin non saturé de s à 
t, on en déduit qu'il fournit un flot maximum. D’après la seconde partie de la 
démonstration ci-dessus, on a le théorème suivant. 


Théorème du flot maximum. Si les capacités sont entières, la valeur du flot maxi- 
mum est égale à la plus petite des capacités des coupures. 


Remarques 


On a supposé que les capacités sont des entiers positifs ou nuls afin d'assurer que 
l'algorithme se termine. Cette restriction est sans importance dans les applications, 
car en choisissant des unités convenables pour les capacités, on peut toujours se 
ramener à ce Cas. 

— La longueur de l'algorithme est conditionnée par la taille des capacités : le temps 
d'exécution peut donc être grand, même pour un graphe ayant peu d’arcs (exercice 
14). Pour augmenter sensiblement l'efficacité de l'algorithme, il faut, dans la phase 
de marquage, chercher systématiquement un chemin non saturé de s à t ayant le 


moins d’arcs possible. 


Généralisations 
Voici deux généralisations au problème du flot maximum. 


Graphe ayant plusieurs sources ou plusieurs terminaux 

On conserve les hypothèses générales faites sur G page 87, mais on ne suppose plus 
l’unicité de la source et du terminal. Au contraire, il peut y avoir des sommets 51,...,5, 
où n'arrive aucun arc (ce sont les sources) et des sommets #1... .t4 d'où ne part aucun 
arc (ce sont les terminaux). On définit un flot de la même façon, la loi de conservation 
devant être vérifiée en chaque sommet différent d’une source ou d’un terminal. 
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La valeur d’un flot f est le nombre val(f)=) <<, vali(f), où vali(f)= acts; u) (Si: U) 

est la somme des flux issus de la source 5;. 

On a aussi val(f) = Diéi<g Darc(ut;) /(V:t5), d'après la loi de conservation. 

Pour trouver un flot maximum sur G, nous allons nous ramener au cas d’une seule 

source et d’un seul terminal. Pour cela, on définit un graphe orienté G” de la manière 

suivante : 

on ajoute à G deux sommets o et 7, 

pour chaque source s;, on ajoute un arc (0,s;) et pour chaque terminal t;, on 
ajoute un arc (t;,T). 

Le graphe G’ a pour unique source o& et pour unique terminal 7. Définissons des 

capacités très grandes sur les arcs qui ont été ajoutés et gardons les capacités sur les 

arcs de G. Tout flot sur G’ définit un flot sur G'; réciproquement, si f est un flot 

sur G, on définit un flot f’ sur G’ en posant f'(a) = f(a) si «à est un arc de G, 

J'(o, si) = val(f) et (65,7) = D aretu,t,) (0 É5). 

Les flots f et f’ ayant même valeur, il suffit d'appliquer à G’ l'algorithme de 

recherche d’un flot maximum : on obtiendra ainsi un flot maximum sur G. 


S1 


sis to les graphes 
o 1 Get G’ 


Flot à double contraintes 

Dans les applications, on doit parfois munir chaque arc à d’une capacité minimum 
m(a) > 0 et d’une capacité maximum M(a). Un flot f est dit admissible si l’on 
a m(a) < f(a) £ M(a) pour tout arc a. Si tous les ma) sont nuls, le flot nul 
est admissible et l'algorithme fournit un flot admissible maximum. Mais si certains 
nombres m(«) sont strictement positifs, le flot nul n’est pas admissible. 


— Si l'on a trouvé un flot f admissible, alors on peut pratiquer l'algorithme du flot 
maximum en partant de ce flot f. On obtient ainsi un flot admissible maximum. 


En général, la question se pose de trouver un flot admis- b 
sible; un tel flot n'existe d’ailleurs pas toujours. Dans le 
graphe ci-dessous, nous avons indiqué à coté de chaque 
arc, l'intervalle [m, M] pour un flot admissible : on vérifie 


facilement qu’il n'existe pas de flot admissible. 


Dans l'exercice 16, on présente une méthode pour chercher 
un flot admissible. 
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a Exercices emmmmmmmnx 


@ 1. Un photocopieur est mis à la disposition de n personnes (n<200). Chaque utilisateur 
possède un code personnel à quatre chiffres permettant d'activer le photocopieur. 


a) Combien y a-t-il de codes possibles ? Combien sont actifs ? 


b) Le nombre d'essais pour rentrer un code est limité à trois. On rentre un code 
au hasard; s’il n’est pas bon, on en rentre un deuxième et éventuellement un 
troisième. Quelle est la probabilité p pour qu'on active ainsi le photocopieur ? (on 
pourra chercher la probabilité 4 = 1—p pour que les trois essais soient infructueux). 

3T 

1—210 

babilité p reste inférieure à 5% : estimer le nombre d'utilisateurs à ne pas dépasser. 


€) Posons x—104n. Montrer que l’on a 3x(1—x) <p< On veut que la pro- 


2. Un événement se produit avec la probabilité 0,25. On veut réaliser une suite 
d'épreuves indépendantes où l’on a neuf chances sur dix que l'événement se pro- 
duise entre vingt et trente fois sur cent. Combien d'épreuves suffit-il de faire ? 


@ 3. Estimation asymptotique d'un indice de dispersion. Pour quantifier la dispersion d’une 

variable aléatoire X, il est naturel de prendre l'espérance d de la variable aléatoire 
IX — E| (bien qu’on préfère plutôt choisir l’écart-type qui se comporte mieux dans 
les calculs). Supposons que X est le nombre de fois qu’un événement de proba- 
bilité p se produit au cours d’une suite de n épreuves indépendantes, autrement 
dit, À suit une loi binomiale : la probabilité que l'événement survienne k fois en 
n épreuves est P(k) = (*)p*(1 — p)". On suppose n = 2N et p = 1/2. 
a) Montrer que l’on a d = D}; ,|k—N}|P(k) et que l’écart-type de X est o = 4/N/2. 
b) En admettant l'égalité 5} (N —k) (A) = : (9), démontrer que d = un nr 
c) Quand NN tend vers l'infini, on a N!'<NVe-N/27N (formule de Stirling). Montrer 
que d/o tend vers 2/7 quand N tend vers l'infini. 


4. On repère les points de l’espace par des coordonnées cartésiennes. Les points à co- 
ordonnées entières sont les sommets de parallélépipèdes à arêtes parallèles aux axes. 
Comme pour un quadrillage dans le plan, considérons les chemins formés d’arêtes 
orientées dans le sens des coordonnées croissantes. Si p, q, r sont des entiers positifs, 

@+a+r)! 


montrer qu'il y a Soir! 


(p,q,r). 


chemins joignant l’origine au point de coordonnées 


@ 5. Soient n, a, b des entiers positifs ou nuls. On cherche le nombre N de solutions (x,y,z) 
de l'équation t+y+2=—n, où x, y, z sont des entiers positifs vérifiant 1 < x < a et 
1<y<b. On pose S—{(x,y,2)|x,y,2 entiers, x >1,y>1,22>1,x+y+2=n}, 


A={(x,y,2)ES|r>a}, B={(x,y,2)€eSl|y>b}. 
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@ 10. 


q) eu que N est le nombre d'éléments de l’ensemble 4'NB, où 4’ =S\ A et 

=$S\.8: 

. Montrer que |4 NB'|=}S|-|A|-|B|+|AN BI]. 

c) Montrer que |A} est le nombre de solutions (u,y,z) de l'équation u+y+2z=n—a, 
où u,y,z sont des entiers strictement positifs (s'inspirer de l'exemple page 64). 
En déduire |A] = ("5 ) 

d) Montrer de même que l’on a |B| — de et [AN B|=— (), En déduire la 
valeur de N. 


. Un vacancier veut envoyer des cartes postales à quatre personnes. Il achète sept 


cartes différentes. De combien de façons peut-il toutes les expédier ? 


. Pour tout entier n > 1, posons E, — {1,2,...,n}. 


a) Soit f : En41 — E, une application. Montrer que si f(En1) = En, il existe un 
unique élément b € E, ayant deux antécédents. 


1 
b) En déduire qu’il y a n! ni 


applications de FE,,,1 dans F, ayant pour image E,. 


. Autre calcul du nombre d'applications ayant pour image leur ensemble d'arrivée (page 66). 


Soient p et n des entiers positifs tels que p > n. Si U est un ensemble à p éléments 

et si V est un ensemble à n éléments, on note s(p,n) le nombre d'applications 

h : U — V telles que h(U) = V. On pose E, = {1,2,...,p} et En = {1,2,...,n}. 

a) Soit B une partie de E,. Montrer que si B possède k éléments, il y a s(p,k) 
applications f : E, — E, telles que f(E,) = B. 


b} En déduire l'égalité n° = 35, (F)s(p, k). 


c) Expliquer comment cette égalité permet de calculer les nombres s(p.,k) de proche 
en proche. 


Nombre de partitions d'un ensemble. Soit E un ensemble à p éléments et soit n un en- 
tier tel que 1<n<p. Une n-partition de E est la donnée de n parties A1,42,...,4, 
de Æ formant une partition de E : cela signifie que les parties A; sont non vides, 
deux à deux disjointes et que leur réunion est Æ. 


a) Expliquer comment une application f:E—{1,2,...,n} telle que f(E)= Fe ….,n} 


détermine une n-partition de E : considérer les parties A; ={xe E | f(x) =i}. 
b) Montrer qu'il : a autant de n-partitions de Æ que d'applications f:E si > 
telles que f(E) = {1,2,...,n)}. 


Étude d'une permutation 


a) Décomposer en cycles à supports disjoints la permutation s suivante : 


il11213/14/5l617|1819 1101112 
s(i)|9 121811 4131210511 6|7 
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b) Quel est le plus petit entier r > 1 tel que s” soit l'application identité ? 


c) Calculer explicitement la bijection s!% (faire la division euclidienne de 100 par r). 


@ 11. Calculs dans le groupe des permutations de six objets 
a) Combien y a-t-il de permutations d’un ensemble à six éléments ? 


b) Pour une permutation de l’ensemble E = {1,2,3,4,5,6}, quelles sont les possi- 
bilités de décomposition en cycles à supports disjoints ? En déduire que si s est 


une permutation de l’ensemble E, alors s!? est égale à l'identité ou à s?. 


12. Une utilisation des graphes en Biologie. L'étude de l’évolution moléculaire conduit à 
définir des écarts entre certaines séquences d'ADN. Les distances entre ces séquences 


permettent de faire des hypothèses sur l’ordre dans le- 


quel s'effectuent les duplications de gènes. Voici une CAE ER AIE. 


table des distances entre six séquences impliquées dans 5 15,6] 0 
la synthèse de protéines fixatrices d'oxygène. e [6,1,2,4, 0 
5,912,7| 2 10 


a) Trouver un arbre de longueur minimum reliant ces | 7 
séquences. u |7,517,6|17,717,6| 0 


clal64ale 618 


b) Calculer la longueur d’un plus court chemin entre 
deux séquences données. 


13. Soit G un graphe orienté connexe ayant une source, un terminal et une capacité 
pour chaque arc. On suppose qu'il existe un cycle C'= (uo,wi,...,Up-1,u0) que l’on 
peut parcourir en respectant l'orientation des arcs. 


a) Montrer que les sommets s et { ne sont pas dans le cycle C. 


b) Soit f un flot sur G et soit k un nombre inférieur aux valeurs c(æ) — f(a), où 
a sont les arcs du cycle C. Pour chaque arc a de G, posons f'(a) = f(a) si a 
n’est pas un arc de Cet f’(a) = f(a) + k sinon. Montrer que f” est un flot sur 
G et que l’on a val(f') — val(f). 


14. Considérons le graphe orienté ci-contre, où la capacité de 
chaque arc est indiquée entre parenthèses. Le nombre m est 
un entier, s est la source et { est le terminal. 


a) On part du flot nul et l’on pratique l'algorithme du flot 
maximum en utilisant, lors du marquage, alternativement 
les chemins 1 = (5,a,b,t) et 32 = (s,b,a,t). De combien 
augmente la valeur du flot à chaque étape ? 


b) Montrer qu'il faut 2m augmentations du flot pour obtenir un flot maximum. 


@ 15. Recherche d'un flot maximum. Pour le graphe orienté ci-dessous, les chiffres entre pa- 
renthèses indiquent la capacité des arcs. Trouver le flot maximum pouvant transiter 
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de la source s vers le terminal t£. 


16. Recherche d'un flot admissible dans le cas de doubles contraintes. Soit G un graphe 


orienté vérifiant les hypothèses faites page 87. Pour chaque arc à de G, on note 
m(a) la capacité minimum de l'arc et Ma) sa capacité maximum, en supposant 
0 < m(a) < M(a). Soit G* le graphe orienté obtenu de la manière suivante : 
on ajoute à G deux sommets s* et {*; 
pour chaque arc a ={(u,v) de G, on ajoute un arc «/=(s*,v) et un arc a/=(u,t*); 
- on définit les capacités sur G* en posant, pour tout arc a = (u,v) de G : 

c(a) = ÿ. m{z,v) , c(a”) = 2 m{u,z) et c(a) = M(a) -m(a); 

zeG z€G 

on ajoute un arc ({,s) de «capacité infinie ». 


schéma de définition 
du graphe G* 


a) Vérifier que G* est un graphe orienté ayant pour seule source s* et pour seul 
terminal {*. 
Un flot f* sur G* est dit saturant si l’on a f*(a') = c(a/) pour tout arc a de G. 


b) Montrer qu'un flot saturant est un flot maximum sur G*. 
On suppose désormais que f* est un flot saturant sur G*. Pour tout arc a de G, 


on pose f(a) = f*(a) + m(a). 
c Montrer que l’on a ma) < f(a) £ M(a) pour tout arc a de G. 


d) Montrer l'égalité De de @ J'(@) = D arcade G J'(@) = D rca de & M). 

e) En déduire que pour tout arc a de G, on a f*(a”) = c(a/). 

f Soit u un sommet de G différent de s et de t. Montrer que l’on a 
made er ae ft): 


g) En déduire que f est un flot admissible sur G. 
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h}) Pour le graphe G& suivant, représenter le graphe G*, trou- 
ver un flot saturant f* sur G* et calculer le flot admissible 
J. Le flot f est-il maximum? Quelle est la valeur d’un 
flot maximum sur G? 

Voici une méthode pour rechercher un flot admissible sur 
G ou pour montrer qu'il n’en existe pas : 


a 


- trouver un flot maximum f* sur G*, en utilisant par exemple l'algorithme du 
flot maximum ; 

si f* est saturant, alors le flot f défini comme ci-dessus est un flot admissible 
sur G'; 

si f* n'est pas saturant, on peut montrer qu’il n'existe pas de flot admissible 
sur G. 
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Chapitre 4 


Equations 
linéaires et vecteurs 


1. Vecteurs et combinaisons linéaires 
1.1 Les espaces vectoriels R? et C? 


Rappelons que R? est l’ensemble des p-uplets (21,2%2,...,æ,) de nombres réels; de 

même, C? désigne l’ensemble des p-uplets de nombres complexes. Nous désignons 

par la lettre K l’ensemble R ou C. 

Un élément de K? s'appelle un vecteur à p coordonnées et, pour cette raison, 
l'ensemble K? s'appelle un espace vectoriel. 

Le vecteur (0,0,...,0), dont toutes les coordonnées sont nulles, s'appelle le vecteur 
nul et se note simplement 0. 


Les éléments de K s'appellent des scalaires : ce sont des nombres. 


Notation. Un vecteur (x1,...,2,) est souvent noté : et appelé alors une 
matrice-colonne. 


Opérations sur les vecteurs de K? 


Définitions 
Soient u = (21,%2,...,%p) et U = (y1,y2,...,Yn) des vecteurs de KP. 
La somme des vecteurs u et v est le vecteur u+u= (21 +y1,t2+y,.. To + Up). 
Sous forme de matrices-colonne, cela s'écrit 
T1 yi T1 + Y1 
T2 ya T2 + 2 
‘ + ‘ : 


Tp Yp Tp + Yp 


CHAPITRE 4 - ÉQUATIONS LINÉAIRES ET VECTEURS - 101 


Si a est un nombre de K, le produit du vecteur « par le scalaire a est le vecteur 


au = (ati, aï2,...,a%y), Ou encore 
PA ax] 
T2 ax) 
a = : 
Tp ATp 
Soient u1,Uu2,...,u, des vecteurs de K?. Une combinaison linéaire des vecteurs 
ui, U2,...,Un est un vecteur de la forme aju1 + aou2 +: --+anün, OÙ @1,42,..., 4m 


sont des scalaires. 


Si u est un vecteur non nul et a un scalaire, le vecteur au est dit colinéaire à u. 


Si a, b sont des scalaires et u, v des vecteurs de K?, alors on a 


au+bu—={(a+blu et a(u+v) = au + av. 


Exemple 1. Posons u — (2,1,—1), v —(3,1,—2) et w — (0,1,2). Si x,y,z sont des 
nombres réels, la combinaison linéaire œu + yu + zw s'écrit matriciellement 


2 3 0 2x 3Y 0 2x + 3y 
x 1|+y + 2 = x | + yl+| z| = T+y+z 
—1 —2 2 —% —2y 2z —Z — 2y +23 
c B 
de 2. un le plan euclidien R?, les points À = (1,0), B = 
—1/2,V3/2) et C=(-1/2,-V3/2) sont les sommets d’un triangle équi- A 


mn. centré à . O : la somme OA+OB+OC est le vecteur nul. c 


Définition 
Pour tout indice à compris entre 1 et p, notons e; le vecteur de K? dont toutes 
les coordonnées sont nulles sauf celle d'indice à qui vaut 1 :ona 


= 01,0,0,.,,0)..-e=10,1,0..:,0), 4 es = (00.430,17) 
1 0 0 
0 1 0 
et matriciellement : E1 = 0 , E2 = 0 5. Ep = |: 
J . . 
0 0 1 
Les vecteurs e1,e2,...,e, s'appellent les vecteurs canoniques. 
Pour tout vecteur (x1,...,x,) € K?,on a 
T1 1 0 0 
T2 0 1 0 
.[=ml.|+æl.|+.+m |. |] =mE1+20E2+...+%,E,. 
%p 0 0 1 


Tout vecteur de K? s'écrit donc de manière unique comme combinaison linéaire des 
vecteurs canoniques. 


102 - VECTEURS ET COMBINAISONS LINÉAIRE 


un 


© Dunod -— La photocopie non autorisée est un délit. 


1.2 Sous-espaces vectoriels de K? 
Définition 
Soit V une partie de K?. On dit que V est un sous-espace vectoriel de KP si 
ile vecteur nul appartient à V, 


ü) pour tous vecteurs u et v appartenant à V,ona u+veV et au € V quel que 
soit le scalaire a € K. 


Exemples 

- Soit D l’ensemble des (x,y) € R? tels que 3x — 2y = 0. y 
Le vecteur nul (0,0) appartient à D. Supposons que les vecteurs À 7 D 
u=(x,y) et u=(x,y") appartiennent à D, donc 37—-2y—0=—3%-2y. : - 


On a 3(x+2)—-2(y+y)=(3x-2y)+(3x —2y)=0, donc u+u' ED. 
De même, pour tout a€ R, on a 3(ax) — 2{ay) = a(3x — 2y) = 0, 
donc au € D. 
L'ensemble D est donc un sous-espace vectoriel de R?. Géométriquement, D est 
la droite passant par l’origine et dirigée par le vecteur (2,3). 
- Soient r un nombre réel et P = {(x,y,2) € R° | 3x — 2y + rz = 0}. 
Supposons que les vecteurs u—(x,y,z) et u—(x’,y',z") appartiennent à P. On a 
3(x+x)—-2(y+y)+r(z+2)=(8r-2y+r2)+ (8x —-2y +rz)=0 et, pour tout a€R, 
3(ax) —2(ay) +r(az) = a(3x — 2y+7rz2) <0, donc u+u/ et au appartiennent à P. 
Puisque le vecteur nul appartient à P, P est un sous-espace vectoriel de R° : c’est 
le plan passant par l’origine et orthogonal au vecteur (3,—2,r) ; le plan P coupe 
le plan des x,y (d’équation z = 0) selon la droite D précédente. 
Soient ui,u2,...,u, des vecteurs de K? et soit V l’ensemble de toutes les combinai- 
sons linéaires des vecteurs u1,u»,...,u, : alors V est un sous-espace vectoriel de K?. 
En effet, le vecteur nul est égal à la combinaison linéaire Ou; +Ou2+---+0u,, donc ap- 
partient à V. Soient u=viui+.--+7Au, et U=yiu +---+yu, des vecteurs de V.On 
au+u= (x; +yi)u +. +(x +yn)un, donc u+v est un vecteur de V. De même, on 
a au=(axti)u1 +---+(ax,)u,, donc pour tout scalaire a, le vecteur au appartient à V. 


Définition 

Soient u1,u2,...,u, des vecteurs de K?. L'ensemble de toutes les combinaisons 
linéaires des vecteurs u1,u2,...,u, est un sous-espace vectoriel de K? appelé le 
sous-espace vectoriel engendré par u1,...,Un. 


1.3 Equations linéaires 


On a souvent besoin de savoir si un vecteur bE KP est combinaison linéaire de vecteurs 
ui, U2,...,Un donnés et si oui, de calculer les coefficients d’une telle combinaison. 
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Définition 

Soient u1,u2,...,u, des vecteurs de K? et soit b € K?. Trouver tous les nombres 
T1, T9,..., En tels que Tu + Tous +: + zu, = b s'appelle résoudre l'équation li- 
néaire œyu1 + Lou +: + Tnün = 0. Une solution de l'équation est donc un élément 
(T1, %2,...,Æn) € K”. 


Supposons que u1,ur,...,u sont des vecteurs de K?. Pour désigner en général les 
coordonnées de ces vecteurs, on utilise des lettres munies de deux indices, en posant 


Uj = . pour i—=1,2,...,n. 


Le premier indice est le numéro de la coordonnée, le second est le numéro du vecteur. 
Pour tous scalaires æ1,...,2,, la combinaison linéaire tiu1+vou2+: +, u, est égale à 


ai @12 Gin QT + @1222 +: + AinEn 
Q21 Q22 An QT + Q22%9 + +" + Ann 
Li . + To ; ses D : = 
Qp1 Qp2 Gpn Gp1T1 + Qp2T2 SC GpnTn 
Si b—(b1,b2,...,b,), résoudre l'équation linéaire æiui + tour ++: +x,u, = b consiste 
donc à calculer les (x1,...,11) € K” vérifiant les équations numériques 


@1t1 + @2T9 + + + QGinln = 01 

QT + Q22%9 + ++ + GonTn = b2 
(s) 

Gp1T1 + &p2T2 sors Apnln — bp 


Un tel ensemble d'équations s'appelle un système linéaire de p équations à n inconnues. 
Les vecteurs u1,...,u, sont les vecteurs-colonne du système. 


Le vecteur b s'appelle le second membre du système. 


Exemple. Considérons le circuit électrique ci-contre, du type 
«pont de Wheatstone ». Les résistances ont pour valeurs (en ohm) 
r1,72,73,74,75 et E est un générateur. On a choisi un sens de par- 
cours sur chaque portion du circuit, de sorte que les intensités 
1, 42,03, 44,5 sont des grandeurs algébriques. L’intensité dans le 


circuit principal est à1 +4 = 2 +3, en vertu de la loi des courants 


dérivés et l’on a de même 4 = i3 +45, 49 = 1 +45. D’après la loi 
d'Ohm , la différence de potentiel entre les points À et B est rsis=riti —Trata=Tais Toto 
et la différence de potentiel aux bornes du générateur est e = riis + Toto = rats + Tata. 
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Les intensités sont donc solutions du système linéaire : 


Ti + Toi = € 

Tal3 + Tata = € 

Titi = Tata — T5Ù5 = 0 
Too — Tag + Tsis = 

à — 29 — 23 +4 = 0 

43 — 44 +5 = 0 

à — 9 +5 = 0 


Système homogène 
Si le second membre b est le vecteur nul, on dit que le système linéaire (ou que 
l'équation linéaire correspondante) est homogène. 
Soit æju1 + tou2 + +: + ïnüun = 0 une équation linéaire homogène. Le vecteur nul 
T1 = La =: —= 2» = 0 est évidemment solution. Si (x1,%2,...,%,) et (x,,29,...,x/) 
sont solutions, alors on a 

(ai+a uit (xo+ai)us+ ++ (tnt )un = 

= (riui+rou2+ + +Enun)+(aiui+tou2+ : -: +xh un) = 0 


et pour tout scalaire a, 
(ax }us + (ato)uo +++: + (atn)un = Ati + Touo +++ + nur) = 0. 


La somme de deux solutions est donc une solution et le produit d’une solution par 
un scalaire est une solution. 


Proposition. L'ensemble des solutions d'un système linéaire homogène à n inconnues 
est un sous-espace vectoriel de K. 


1.4 Vecteurs indépendants et bases 


Définition 
Soient u1,...,u, des vecteurs de K?. Si l'équation linéaire æiu; +-::+xyun = 0 
a pour seule solution æ; = x2 =: — x, — 0, on dit que les vecteurs u;,u2,..., un 


sont indépendants. 


D'après cette définition, des vecteurs sont indépendants si aucun d’entre eux n’est 
combinaison linéaire des autres. 


Théorème. Soient u,u2....,u, ,v des vecteurs de K?. Si u1,u,...,un sont indépendants 
et si ui,Uu2,...,u\,U ne le sont pas, alors v est combinaison linéaire des vecteurs u1,u2,...,un. 


Démonstration. Puisque les vecteurs u1,u2,...,u,,v ne sont pas indépendants, il existe une 
relation linéaire tu +rou +---+xu, + yv =0 où les scalaires %1,...,7,,y ne sont pas tous 
nuls. Si l’on a y = 0, alors il vient tiui + Tous +---+rau, =0, donc %1 =%2 =... =, =0 
car les vecteurs u1,u2,...,uA sont indépendants; dans ce cas, tous les scalaires æ1,...,%n,y 
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sont nuls et cela est contraire à ce qu'on a supposé. On en déduit que y # 0. De l'égalité 
de départ, on tire alors vu = —(x1/y)u1 — (x2/y)ua — -:: — (x, /y)u, et le vecteur v est bien 
combinaison linéaire de u1,...,un. = 


Théorème. Soient uj,u2,...,u, des vecteurs de KP. Supposons qu'il existe des scalaires 
x; et y; tels que tiui + Tous + + + Taün = Yi + Youo +: + Ynün. Si les vecteurs 
ui, U2,..., Un Sont indépendants, alors x; — y; pour tout i. 

Démonstration. D'après les règles de calcul sur les vecteurs, on a 


O=(riui+Touo+ tan )—(yr ur +Yÿou2 + Yan )= (Ti Yi) + (T2 ya )u2 + + + (En —Yn)ün 


Si les vecteurs u1,u2,...,u, sont indépendants, alors par définition æ1 — y1 = T2 — ya =: — 
Tn — Yn = 0, donc +; = y; pour tout 1. = 
Définition 
Soient wi,u2,...,un des vecteurs de K? et soit V le sous-espace vectoriel engendré 
par ces vecteurs. Si u1,u2...,u sont indépendants, on dit qu'ils forment une base 
de V. 


D'après les théorèmes qu’on vient de montrer, on a ainsi la propriété suivante. 


Des vecteurs ui, u2,...,un de K? forment une base de V si et seulement si tout 
vecteur de V s'écrit de manière unique comme combinaison linéaire de ui ,u2,...,un. 


Proposition. Soient u1,Uu),...,u, des vecteurs appartenant à V. Ces vecteurs forment 
une base de V si et seulement si l'application (x1,%2,---,%n) = ti + tous +++: + num 
de K” dans V est une bijection. 


Exemple. Les vecteurs canoniques e1,..., e» de K? forment une base de K?. 
En effet, tout vecteur 4=(x11,...,1%,) appartenant à K? s'écrit 2161 +%72e2+:--+%,ep=t. 
Tout vecteur de K? s'écrit donc de manière unique comme combinaison des vecteurs 
canoniques. 
Définition 
La base de K? formée des vecteurs canoniques e:,e2,...,e, s'appelle la base 


canonique de K?. 


Exemple. Résolvons l'équation linéaire æiui + tour = b, où wi, u2 et b sont les 
vecteurs de R? définis par u1 = (1,1), uo = (—2,—3) et b = (b1,b>2). 
On a x: 1] +9 =] = [ei _ . | , donc l'équation s'écrit sous la forme du système 
linéaire 
T1 — 2% — bi 
LU = 329 —= bo 
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De la première équation, on tire æ1 = bi +222 et en reportant dans la deuxième 
équation, on obtient (b1 + 2x2) — 3x9 — —%2 + bi — br, d’où les équivalences 

Xi — 2%9 = bd 1 = bi + 2%: æ1 = bi + 2(b; — b 

1 2 1 1 1 + 2% 1 1 + 2(b1 — be) 

Œ1 — 329 = bo to = bi — bo Zo = bi — bo 
Il y a une unique solution (x1,2%2) = (3b1 — 2b2,b1 — bi). 
La seule façon d'exprimer le vecteur b comme combinaison 
linéaire des vecteurs u1,u2 consiste donc à écrire 

(3b1 . 2b2)u + (b1 = b)u —= bd. 

Les vecteurs u1,u2 forment une base de R?. Si b—(0,0), l'équation 
est homogène et a pour unique solution æ1 = %2 = (0. 


Tou2 


2. Résolution des équations linéaires 
2.1 Méthode de Gauss : pratique et exemples 


Considérons le système d'équations 


QauT1 + @2%9 + ++ + Gin£n = bi (eq) 

Qn T1 + G22%2 + +: + Gontn = bo (eq) 
(s) 

ApiTi + Gp222 oem apnln — br (eq,) 


Si le coefficient a11 n’est pas nul, on peut tirer x, de la première équation : 


T1 = bi — (a2/au)to — (a13/au1)T3 — ++ — (ain/a11)En - 
En reportant cette expression de x, dans les autres équations, on obtient un système 
où ne figurent plus que les n—1 inconnues %2,...,,. La méthode de Gauss consiste 
à répéter cette opération successivement sur les inconnues restantes. C’est ainsi que 
nous avons procédé dans l'exemple précédent. 


Pratiquement, on transforme le système ($S) en un système équivalent (c’est-à-dire 
ayant les mêmes solutions) au moyen d'opérations sur les équations du système. 


Opérations permises 

opération 1 : changer l’ordre des équations ; 

opération 2 : multiplier une équation eq; par un scalaire a non nul, c’est-à-dire 
remplacer eq; par eq, = a eq;, où a £ 0. 

opération 3 : ajouter à une équation eq, un multiple quelconque d’une autre, c’est-à- 
dire remplacer eq; par eq; —=eq;+aeq;, où if j et où a est un scalaire quelconque. 

Ces mêmes opérations permettent de retrouver les équations de départ : en effet, 

si ed, — a eq;, où à est un scalaire non nul, alors eq; — (1/a) ed! ; 


— si eq; — eq; +a eq;, où à À j, alors eq; — eq; —a eq;. 
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Lorsqu'on effectue ces opérations, le système d'équations est donc bien transformé 


en un système qui a les mêmes solutions. 
T1 + 2T9 — 23 = b: 


( 
2% + 5%9 + 3 = bo ( 
di + dt + 5%3 = b3 (eds 
Titto— 323 ba ( 


Exemple 1. Soit le système d'équations (S) 


Pour éliminer l’inconnue x, dans les équations eq, eq; et eq,, formons les équations 
1 2 3 4 


ed —edp—2eq : Zo+3x3  —b2 — 2b 
ed =eqds ed : 272+6%3 —b3—b: 
ed = edy—eq ?  — 22 — 2x3 = ba — bi 


On obtient le système équivalent : 


Ti +229 — 23 = di (eq) 

do + 3x3 = bo — 2b (eq) 

S) — , 
( ) 2%) + 6x3 — b3 — b. (eq:) 
— 29 — 223 = db — b (eq) 


Éliminons maintenant x> dans les deux dernières équations en formant les équations 
eqs — eq —2 eq» et eq} — eq +eqh. Il vient 
T1 + 2%2 — T3 = di ( 
do + 3x3 = bo — 2b: . 
23 = —3b1 + bo + ba ( 
0 = 3b1 — 2b + b3 (eq 


Br 


Premier cas : 3b; — 2b2 + b3 0. Le système (S) n’a pas de solution, car l'égalité 
(eq) n’est pas satisfaite. 

Second cas : 3b1 — 2b2 + b3 — 0. Le système se réduit aux trois équations (eq), 
(eq), (eq{). La dernière donne x3, puis on tire x2 de la seconde et enfin +1 de 
la première : 


Ti =—2%9 +23 +0: Li =—2%9 +23 + ti =—16b,+5b2+7b4 
(S)— Zo=b2—2b—-373 > 4 22—= 701 —-2b2 —3b4 > € t2—7b; — 2b2 —3b, 
z3=—3b1 +b2+0b4 a3=—3b1 +02 +b4 d3=—3b1+b2+b4 


et dans ce cas, le système a une unique solution. 


Si la condition 3b1 — 2b2 — b3 — 0 est satisfaite, le système a une unique solution; 
sinon, il n’a pas de solution. 


Exemple 2. Modifions le système d'équations de l'exemple précédent en suppri- 
mant la dernière équation et en posant bi = b2 —1, b3 = —1 : l'égalité 3b1 — 2b2 + b3 — 0 
est ainsi satisfaite. Ce système s'écrit 


ti +2%—%3— 1 (eq) 
(S) 221 +5ro+a3— 1 (eqo) 
di + 4x0 + 5%3 = —1 (eq) 
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En faisant les mêmes opérations que précédemment, il vient les équivalences 


L1+2%o—2%3 = 1 (ed) di = 1 —- 2% +%3 dt = 3 +723 
zo+3x3 = —1 (eq) Lo = —1— 373 Lo = —1 — 373 


(5) 
Si l’on donne à x3 n'importe quelle valeur t, on obtient les solutions 


BA 3 + 7t 3 7 
T2 — —= 1 —3 


1 —3t +t 
A des valeurs de { différentes correspondent des solutions différentes : le système 


t 


(S) possède donc une infinité de solutions. Si l’on représente (x1,%2,%3) par un 
point de l’espace R°, les solutions décrivent la droite passant par le point (3, —1,0) 
et de vecteur directeur (7,—3,1). 


27% —T2+ T3 — Ta — 0 (eq) 
321 — Zo + 3x3 — 224 — 0 (ec) 
où les inconnues sont les nombres réels +1,%2,%3,4. 


Exemple 3. Soit le système linéaire homogène (5) { 


En remplaçant eq par 2eq, —3eq,, l'inconnue x; disparaît dans la deuxième équation 
et (S) est équivalent à 


a = 0 (eq) : = Lo—T3+T4 é = —2%3+T4 


to+3x3—x4 = 0 (2 eq —3 eq)) Lo = —3t3+ T4 Lo = —3t3+%4 
T1 —2%3 + T4 —2 1 
mo | _ | -3x3+a| _. | -3 1 
z3 | T3 SP 
T4 TA 0 1 


On peut donner à x: et x4 des valeurs réelles arbitraires : les solutions de (5) sont donc 


LT] —2 1 
T2 | —3 r|1 N ! 
ge | = t| j[+t ll, oùtett sont des nombres quelconques. 


TA 0 1 


Posons u = (—2,—3,1,0) et u —(1,1,0,1). Les solutions sont toutes les combinaisons 
linéaires de u et u', autrement dit l’ensemble des solutions est le sous-espace vectoriel 
V de R‘ engendré par les vecteurs u, u’. Les deux dernières coordonnées du vecteur 
tu +t'u’ sont t et {’; si l’on suppose que tu + t'u' = 0, alors t = 0 et { — 0. Cela 
montre que les vecteurs u et uw’ sont indépendants. Les vecteurs u et u” forment donc 
une base du sous-espace vectoriel V. Le système possède une infinité de solutions. 


Remarque 

La méthode de Gauss n’est pas une bonne méthode numérique pour résoudre des 
systèmes linéaires de grande taille : elle nécessite beaucoup d'opérations et le résultat 
est trop sensible aux erreurs d’arrondi. Nous présenterons au chapitre 8 quelques 
méthodes de résolution numérique plus efficaces. 
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2.2 Résolution des systèmes linéaires 


Reprenons le système de p équations à n inconnues 


Qui + @2%0 + + + Gintn = di (ed) 

Qu T1 + G22%9 + +: + Gonln = Lo (edo) 
(S) 

GpiT1 + Qp282 +++ ApnEn = bp (eq) 


Échelonnement du système. Supposons que dans (S), l’un des coefficients de 
æ1 n’est pas nul (sinon, l’inconnue x: n'apparaît pas et le système n’a que les 
n—1 inconnues %2,...,2). En plaçant en première position l’une des équations où 
apparaît 41, on peut supposer an £ 0. 

Comme on l'a vu, la méthode de Gauss consiste à faire les opérations qui éliminent 
æ1 dans les équations eq,...,eq,, et à continuer successivement l'élimination des 
inconnues qui restent. 

À chaque étape, on a éliminé au moins une inconnue dans les dernières équations ; 
cela peut produire certaines équations où ne figure plus d’inconnue, comme dans 
l'exemple 1. 

En réordonnant éventuellement les équations en cours de calcul, on trouve, comme 
dans les exemples précédents, un système ($’) équivalent à (S) et de la forme : 


! ! ! ! ! 

T1 + d12T2 + 3T3 ++ din = bi (edi) 
! 14 ! ! 

Lis + Qoi41Tiot1 +" + Gontn = D) (eqo) 
! ! ! ! 

Lis + Gig41List1 +" + Ginn — 03  (eq3) 


Li, + Be 11H Far dd = b,. (eq) 
0 = bei: (ed.1) 


y ! 
O—b, (eq,) 
Un tel système est dit en échelons. Voici les caractéristiques d’un système en échelons. 
i Dans les r premières équations, les inconnues de tête %1,%:,,%:,,...,2;. Ont leurs 
indices strictement croissants : 1 = à, < io < i3 < °°: <iy <N. 


ii) Chaque inconnue de tête a pour coefficient 1 : on obtient cela en divisant une équa- 
tion ag +@pr1Tk41 +: +aQntn = 5 par le coefficient à 0 de l’inconnue de tête. 


ï) Le nombre r d'équations contenant des inconnues est bien sûr inférieur ou égal 
à n et à p. 

Nous verrons bientôt que ce nombre r d’inconnues de tête ne dépend que du système 

(S) et non pas de la manière dont on s’y est pris pour l’échelonner. 
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Définitions 

— Le nombre r s'appelle le rang du système (S) ou de l'équation linéaire. 

— Si l'on a r < p, les p —r dernières égalités (celles dont le premier membre est 
nul) s'appellent les égalités de compatibilité. 


Puisque les systèmes (S) et (S’) ont les mêmes solutions, on en déduit : 

Si l’une des égalités de compatibilité n'est pas satisfaite, alors le système n'a pas de solution. 
Compte-tenu du déroulement de la méthode de Gauss, on a les propriétés suivantes. 
Le rang d’un système linéaire ne dépend pas du second membre. 

Le second membre de (S’) ne dépend que du second membre de (S). 

— Si le système est homogène (son second membre est nul), alors toutes les égalités de 


compatibilité sont satisfaites : en effet, chaque nombre b! s'obtient en faisant des com- 
binaisons linéaires de b,,...,b. ; si tous les b; sont nuls, il en va donc de même des b!. 


Fin de la résolution. Supposons que l’on a r = p (il n’y a pas d'égalité de com- 
patibilité) ou bien que toutes les égalités de compatibilité sont satisfaites : dans ces 
cas, le système se réduit aux r premières équations. 

On poursuit alors la résolution en exprimant, dans les r premières équations, les in- 
connues de tête en fonction des autres; pour simplifier, supposons que les inconnues 
de tête sont %1,%2,...,%- (il suffit de rénuméroter les inconnues pour qu’il en soit 
ainsi). Le système (5) s'écrit alors sous la forme 


%1 = D — ao — ce ce — ln 

za = bs — A3T3 — v.. — ConTn 
(5°) 

Tr = b, — pri Brt1 0  — GrnEn 
Il est maintenant facile d'exprimer chacune des inconnues %1,...,2, au moyen de 
Lr41,.-., ln : 


- on reporte l'expression de x, dans l'avant dernière équation, ce qui donne %,-: 
en fonction de æ;11,...,%n, 

- puis on opère par reports successifs dans les expressions de %,_2,...,21. 

Distinguons deux cas. 

Premier cas : r — n. Alors la dernière équation s'écrit x, = b, et de proche en 
proche, on calcule la valeur de %,_1,...,x%1. Le système possède dans ce cas une 
unique solution. 

Second cas : r < n. Après report des inconnues %,:1,...,%, le système s'écrit : 

D = Di + NrnErt1 + Vir2Tr42 + 2 + VinEn 
Do = Pa + Y2r1Tr41 + Vr42%r49 + +. + VonEn 


Tr = Pr + Yrr 1Lr41 + Yrr42Tr49 + 2: + Yrnn 
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ou encore 


T1 Bi NrH Nir+2 Yin 
Tr Br Vrr+1 Vr r+2 Vrn 
tr | = | 0 | FTrH 1 + Lr+2 0 + +aln | 0 
Tr+2 0 0 1 0 
Tn 0 0 0 | 1 
Posons x =(x1,...,%n), w—(/1,...,/8,,0,...,0) et notons w,,1,...,w, les vecteurs 
en facteur des inconnues %,:1,...,2n. On a donc 


T = Ù + LrhWre + + Tn Un. 


> On obtient les solutions du système en donnant des valeurs arbitraires aux in- 
connues Zr+1,...,%n. Les solutions x s’obtiennent donc en ajoutant le vecteur 
w à n'importe quelle combinaison linéaire des n—r vecteurs w,:1,...,w,. Le 
système possède une infinité de solutions. 

Les vecteurs w,:1,...,w, sont indépendants : en effet, si {,,:1,...,1, sont des 
scalaires, les n—r dernières coordonnées du vecteur t,:1w,11+---+1,w, sont 
trtie..tn ; Si l'on à tyiwrs + +taun = 0, il vient donc t,41 =. =t, =0. 


Conclusion : Les solutions s’écrivent de manière unique 
T = W + tri Wpy1 +: Finn, OÙ Ér+1,...,tn Sont des scalaires quelconques. 


Les nombres #f,:1,...,t, s'appellent les paramètres des solutions. 


Cas d'un système homogène. Si le système (5) est homogène (b — 0), les 
nombres b? sont tous nuls, donc w —0. L'ensemble des solutions est le sous-espace 
vectoriel V de K? engendré par les vecteurs w,,1,...,wn ; puisque ces vecteurs 
sont indépendants, ils forment une base de V. 


Equations d'un sous-espace vectoriel 


Soit V le sous-espace vectoriel de K? engendré par des vecteurs ui, u2,...,un. Un 
vecteur y appartient à V si et seulement si l'équation linéaire 


(+) Ti + Touo + + + Taün = Y 


a au moins une solution, ce qui a lieu si et seulement si les égalités de compatibilités 
sont satisfaites : ces égalités constituent donc des équations du sous-espace vectoriel V. 


Exemple. Soit V le sous-espace vectoriel de R‘ engendré par les vecteurs uw = 
(1,1,2,1), u = (—1,1,1,0), u3 = (1,1,2,1). Un vecteur (71,2, y3,ya) € R* est combi- 
naison linéaire de ui, u2,u3 si et seulement si le système linéaire suivant a au moins 


112 - RÉSOLUTION DES ÉQUATIONS LINÉAIRES 


© Dunod -— La photocopie non autorisée est un délit. 


une solution : 
Ti — To + T3 = Y1 (ed) 
T1 +22 +X3 = Y2 (ed) 
221 + %o + 2%3 = Yy3 ( ) 
Ti +T3 = Ya (eq) 


On a les systèmes équivalents : 


T1 — L2 + T3 = Yi (eq) 
2%9 = —Yi+Y2  (ed)=(eg)-(eq) 
329 = —2y1 + Y3  (ed)=(eas)-2(eq) 
T2 = —Y1 + Ya  (edi)=(eu)-(ea) 
T1 — Lo + T3 = Yi (eq) 
222 = — y + y (eq) 
en. 0 = —2(—2y1 + y3) + 3(—y1 + V2)  —-2eds)+3(ea) 
0 = —2(—y1 + ya) + (ui + Ye)  —-2(ea)+(em) 


Pour qu'il y ait une solution (x1,22,x3), il faut et il suffit que les égalités de 
compatibilité soient satisfaites. Le sous-espace vectoriel V a donc pour équations 
‘ + 3y2 — 2y3 = 0 

y +2 — 274 = 0 
— Par exemple, le vecteur (5,1,4,3) appartient à V et (0,4,6,1) n’y appartient pas. 
Soient vi — (0,1,1,0) et w —(1,1,—1,1). Quelles sont les combinaisons de 


N 


vi et w qui appartiennent à V? Les coordonnées d’un vecteur y combinai- 


U1 0 1 + 
. Y2 | 1 ! 1 _[t+ t 
son de v1 et w sont de la forme 0 t 1 +t re On a 
ya 0 1 t' 


y1 +3y —2ys=t +3(t+8)—-2(t—-4)=t+6E et yi + yo — 2ya = dt +(t+) —-2E —=t. 
Le vecteur y appartient à V si et seulement si l’on a & +64 = t= 0, c'est-à-dire 
si et seulement si t — t’ — 0. Par conséquent, une combinaison linéaire de v1 et vw 
n'appartient à V que si c’est le vecteur nul. 


2.3 Les résultats généraux 


La méthode de Gauss donne les principaux renseignement sur les solutions d’un 
système linéaire. 


Résultats 1. Supposons que le système linéaire (S) possède p équations, n inconnues 
et que son rang est r > 1. 

a) Sir <net s'il y a au moins une solution, alors il y a une infinité de solutions. 

b) Si p <n et s'il y a au moins une solution, alors il y a une infinité de solutions. 


c) Si l’on a r = p < n, alors le système possède une infinité de solutions. 


Concernant les systèmes homogènes, on a les résultats suivants. 
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Résultats 2. Supposons que le système linéaire (S) est homogène. 


a) Si r < n, l'ensemble des solutions du système est un sous-espace vectoriel de K" ayant 
une base formée de n—r vecteurs. 


b) Le système a une unique solution si et seulement si r —n et dans ce cas, la solution est 
le vecteur nul. 


c) Si p < n, le système a une infinité de solutions. 


La proposition suivante concerne le cas important des systèmes linéaires ayant autant 
d'équations que d’inconnues (p = n). Sous forme vectorielle, un tel système s'écrit 


Liu + +Tnün =D, où w,...,u, et b sont des vecteurs de K”. 


Résultat 3. Soient u1....,un des vecteurs de K". Les conditions suivantes sont équi- 
valentes : 


alle rang du système linéaire œiui + +: + tnun = 0 est égal à n; 


b] les vecteurs w1,...,u, sont indépendants ; 

c) quel que soit le vecteur b E K”, l'équation linéaire œiui +---+x,u, = b a une unique 
solution ; 

dj l'application (x1,...,2%n) ti +: +anun de K° dans K° est bijective. 


Démonstrations des résultats. Nous utilisons la discussion et les notations du paragraphe 

précédent, pages 111-112. 

1. S'il y a au moins une solution, c'est que les éventuelles égalités de compatibilité sont satis- 
faites. Si de plus r < n, alors on est dans le second cas et il y a une infinité de solutions; 
si p <n, alors on a r < n, car r < p : cela montre (b}. Si r = p < n, il n’y a pas d'égalité 
de compatibilité et l’on est encore dans le second cas. 

2. Puisque le système est homogène, les égalités de compatibilité sont toutes satisfaites. Si 
r <n, on est dans le second cas et nous savons que le vecteur w est nul. Les solutions sont 
donc les combinaisons linéaires des n—r vecteurs indépendants w,,1,...,w,. Puisqu'on a 
toujours r < n, on en déduit que si le système n’a qu’une solution, alors r — n. Réciproque- 
ment, si r = n, alors on est dans le premier cas et il y a donc une unique solution qui est 
nécessairement le vecteur nul. Nous avons ainsi montré les propriétés (a) et (b). La propriété 
(c) résulte de (a) : en effet, on a toujours r < p, donc si p < n, alors on a r < n. 

3. Les vecteurs u1,...,u. sont indépendants si et seulement si l'équation æiui +:-:+Znun =0 
a pour seule solution x = :-: = x, = 0. D'après le résultat 2 (b), cela équivaut à dire que 
le rang de cette équation linéaire est n, d’où l’équivalence entre (a) et {b). 

Soit be K”. Les systèmes linéaires tiu1 +---+xu, =b et tiui +---+x,u, =0 on même 
rang. Si les vecteurs u:,...,u, sont indépendants, le système linéaire œiu +---+x,u, =b 
a donc pour rang n. On est alors dans le premier cas et le système a une unique solution. 
Réciproquement, si le système linéaire œiu1 +---+x,u, = b a une unique solution, alors 
d’après le résultat 1 (a), l'inégalité r < n n’est pas vraie; puisqu'on a r < n, il s'ensuit r = n. 
Nous avons ainsi montré l’équivalence entre (a) et (c). 

Les propriétés ([c) et (d) sont équivalentes par définition d’une application bijective. î 
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3. Dimension d'un sous-espace vectoriel 
3.1 Définition de la dimension 


Voici une conséquence très importante du résultat 3 précédent. 


Proposition. Soient u1,...,um des vecteurs indépendants appartenant à KP. Suppo- 
sons que v1,...,%,4 sont des vecteurs de KP et que chaque vi est combinaison linéaire de 
U1,...; Um. Si q > M, les vecteurs v1,...,v4 ne sont pas indépendants. 


Démonstration. Par hypothèse, chaque vecteur v; s'écrit v; = aiiu1 + Goiü2 +: + Gmitms 
où les a;; sont des scalaires. Soient z1,...,%, des scalaires et soit e = œivi +-:: + tu. 
On a iv; = Tiajiui + LijGoUu2 + * ++ + Ljdmidm, donc le coefficient de u, dans la combi- 
naison linéaire e est @11%1 + @1222 ++: + 41%. De même, le coefficient de u; dans e est 


Gti + Qi2T2 +: + &igg. Supposons € — Ü. Puisque u1,...,u sont indépendants, il vient 
Q1T1 + 12% +: +aigtg = 0 
Qu T1 + G22%2 +: + aol = 0 


Qm1T1 + Gm222 + °°: + AmqTa = 0 
Si q > m, ce système a plus d’inconnues que d'équations et comme il est homogène, il a une 
infinité de solutions (résultat 2 (c}). L'équation linéaire æiv1 +--:+xçv, = 0 n’a pas que la 


solution nulle, donc les vecteurs v:,...,1v, ne sont pas indépendants. [| 
Corollaire. Si v:,..., v, sont des vecteurs indépendants de K?, alors on a q < p. 

Démonstration. Tout vecteur de K? est combinaison linéaire des vecteurs canoniques 
e1,...,€en qui sont indépendants. Chaque vecteur v; est donc combinaison de e:,...,e». 
Si l’on a q > p, alors d’après la proposition précédente, les vecteurs v1,...,v, ne sont pas 
indépendants. Si les vecteurs v1,...,v, sont indépendants, c’est donc que l’on a q < p. [| 


Théorème. Tout sous-espace vectoriel de K? possède des bases. 


Démonstration. Soit V un sous-espace vectoriel de K?. D'après le corollaire précédent, toute 
partie de K? formée de vecteurs indépendants possède au plus p éléments. Choisissons une par- 
tie {u1,u2....,ua} de V formée de vecteurs indépendants et ayant le plus grand nombre possible 
d'éléments. Soit ve V.Si v est l’un des vecteurs u;, alors v est combinaison linéaire de u:,...,uq. 
Supposons que v est différent de tous les u;. Alors l’ensemble {u,u2....,ua,v} possède d+1 
éléments, donc les vecteurs w1,u2,...,ua,v ne sont pas indépendants. D'après le théorème page 
105, v est combinaison linéaire de u1,u2,...,u4. Ainsi tout vecteur de V est combinaison linéaire 
de u1,...,u4. Puisque ces vecteurs sont indépendants, ils forment par définition une base de V.m 


Proposition. Soit V un sous-espace vectoriel de KP. Toutes les bases de V ont le même 
nombre d'éléments. 


Démonstration. Supposons que les vecteurs u1,...,u,, forment une base de V et que les 
vecteurs V1,...,v4 forment aussi une base de V. Chaque vecteur v; appartient à V, donc est com- 
binaison linéaire des vecteurs indépendants u1,...,u. Si l’on avait 9>m, alors d’après la propo- 
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sition précédente, les vecteurs v1,...,v, ne seraient pas indépendants. On a donc g<m. En échan- 
geant le rôle des bases dans ce raisonnement, on montre de même que l’on a m<q, d'où m=—q.m 


Définition 
Si V est un sous-espace vectoriel de K?, le nombre d'éléments d’une base de V 
s'appelle la dimension de V et se note dim V. 


Voici des conséquences immédiates de la définition. 
a) Puisque la base canonique de K? possède p éléments, on a dim KP — p. 
b) Si V est un sous-espace vectoriel de KP, alors dim V < p. 
En effet, une base de V étant formée de vecteurs indépendants, le nombre de ces 


vecteurs n'excède pas p. 


c) Si un système linéaire homogène à n inconnues est de rang r <n, l’ensemble des so- 
lutions est un sous-espace vectoriel de dimension n—r (résultats 2, page 114). Deux 
systèmes linéaires homogènes qui ont les mêmes solutions ont donc le même rang. 

d) Soit V un sous-espace vectoriel de K?. Si dimV — d<p, alors tout système d’équa- 
tions définissant V est de rang p—d. Un système minimal d'équations définissant 
V possède donc p—d équations. 


3.2 Droites, plans, hyperplans 
Un sous-espace vectoriel de dimension 1 s'appelle une droite; un sous-espace 
vectoriel de dimension 2 s'appelle un plan. 


Un sous-espace vectoriel de K? de dimension p—1 s'appelle un hyperplan de K?. 


Un hyperplan de K? est donc défini par une seule équation (car p — (p—1) = 1). 


Exemples 


Si a,b,c,d sont des nombres réels non tous nuls, le sous-espace vectoriel de R‘ 
d’équation ax + by + cz + dt = 0 est un hyperplan de R‘. 

Si a,b,c sont des scalaires non tous nuls, le sous-espace vectoriel de R° d'équation 
ax + by + cz = 0 est un plan. 

Par exemple, le plan d’équation x —2z=—0 a pour base les vecteurs (2,0,1),(0,1,0). 
- Pour une droite de R, le nombre minimal d'équations est 3—1 — 2 : une droite 
de R° est définie par deux équations non proportionnelles. 
T—y+z =0 
2æ+y—-z—=0 
teur directeur (0,1, 1); c’est l'intersection du plan d’équation x — y + z=0 et du 


Le sous-espace vectoriel de R° d'équations { est la droite de vec- 


plan d’équation 2x + y — z = 0. 
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Sous-espaces affines de R° 


Définition 
Soit V un sous-espace vectoriel de R°. Si À est un point de R*, le sous-espace affine 
passant par À et de direction V est l’ensemble des points M € RŸ tels que AM € V. 


Supposons par exemple que V est le plan d’équation ax + by + cz — 0 et que les 
coordonnées de A sont (x0, Yo, 0). Le plan affine passant par À et de direction 
V a pour équation a(x — xo) + b(y — yo) + cz — 20) = 0. 

Soit u = (p,q,r) un vecteur non nul. La droite affine passant par (x0, Yo, ) et de 
vecteur directeur « est l’ensemble des points (x0,Y%0,20) +t(p,q,r), où t parcourt R. 


Plans en feuillets. Soient P et P' deux plans affines de R°, sécants selon 
une droite D. Les équations de ces plans sont (P) : ax+by+cz+d=0, 
(P) : ax+by+cz+d =0. 
Cherchons la condition pour qu'un plan II d’équation ux +vy+wz+h=0 contienne 
la droite D. 
La droite D est l’ensemble des solutions du système linéaire 

ue ne = -d R 


(D a'x+by+cz=-d 
qui est par hypothèse de rang 2. 


D 


L'intersection IN D a donc pour équations 


ax +by+cz —=—-d 
(2) ax + by +c'z = —-d' 
UE + Vy +wz = —-h 


Supposons que le plan IT contient la droite D. Alors les sys- 
tèmes (1) et (2) ont les mêmes solutions, donc le système (2) 
est aussi de rang 2. On en déduit que, par la méthode de Gauss, la troisième équation se 


transforme en une égalité de compatibilité de la forme 0=AX(—d)+\(—d')+y(—h). Cette 
égalité est satisfaite puisque (2) a des solutions. Il vient donc pour tout (x,y,z) € R* : 


X(ax + by + cz + d) + N'(a'x + by + c'2 + d') + p(ux + vy + wz +h) = 0 
On a x 0, car les équations de P et P’ ne sont pas proportionnelles. Par conséquent, 
ux + vy + wz + h = —(N/u)(axr + by + cz + d) — (N'/n)(a'x +b'y+c'z+d), 


autrement dit : l'équation de II est combinaison des équations de P et de P’. 


Réciproquement, supposons que l'équation de IT est combinaison des équations de P et 
de P'. Tout point de D satisfait à la fois l'équation de P et celle de P’, donc satisfait 
l'équation de IT : tout point de D est donc aussi dans II. 


Résumons : si P et P' sont des plans de R° sécants selon une droite, les plans conte- 
nant cette droite sont ceux dont l'équation est combinaison des équations de P et de P”. 
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3.3 Recherche d'une base 
Vecteurs en échelons 


Définition 
Soit u1,u2,...,un une suite de vecteurs de K?. On dit que la suite est échelonnée 
si ces vecteurs sont tous non nuls et si, pour tout à — 2,3,...,n, la première coor- 


donnée non nulle de u; est d'indice strictement supérieur à l’indice de la première 
coordonnée non nulle de u;_:1. 


Exemple. Voici une suite échelonnée de vecteurs de R° : 


2 0 0 0 
(D) 7 0 0 
u = |a3| , u—= |b3| , u3= | O0! , uw = |0 
aa ba 1 0 
Q5 bs C5 3 
L’équation linéaire tu + Tous + taus + Taus = 0 s’écri 
2x: = 0 
Qt + 7x9 = 0 


a3x1 + b3%2 = 0 
Qat1 + bato + x3 = 0 
a5t1 + b5%0 + C5%3 + 324 = 0 
La première équation donne +, — 0, puis la deuxième s'écrit a X 0 + 7x2 = 0, donc 
x) = 0; la troisième équation est satisfaite, de la quatrième on tire x3 — 0, et enfin 
la dernière équation s'écrit 3x4 = 0, donc x4 — 0. L'équation linéaire a pour seule 
solution 1 = %2 = 3 = æ4 = 0, donc les vecteurs u1,u2,u3,u4 sont indépendants. 


Ce raisonnement pouvant s'appliquer à une suite échelonnée quelconque, on a la 
proposition suivante. 


Proposition. Des vecteurs échelonnés sont indépendants. 


Recherche d'une base 

Dans ce paragraphe, V est le sous-espace vectoriel de K? engendré par des vecteurs 
U1,U2,..., Un. 

On peut effectuer sur les vecteurs u1,...,un les mêmes opérations que celles que 
l’on pratique sur les équations au cours de la méthode de Gauss. 


opération (a) : changer l’ordre des vecteurs; 
opération (b) : multiplier un vecteur par un scalaire a # 0; 


opération (c) : ajouter à l’un des vecteurs un multiple d’un autre, c’est-à-dire rem- 
placer u; par uw, = u; + au;, où à  j et où a est un scalaire quelconque. 


Puisqu’on a u; = u} — au;, l'opération (c) permet de retrouver u; à partir de u!. 
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Proposition. Si l'on applique les opérations précédentes aux vecteurs u1,...,un, on 
obtient des vecteurs qui engendrent le même sous-espace vectoriel V. 


Démonstration. Posons w} = u1 + bus, où b est un scalaire quelconque. Le vecteur u} est 
combinaison linéaire de u, et u2, donc uw! appartient à V. Il s'ensuit que toute combinaison 
linéaire des vecteurs u,,u2,...,u, est dans V. De même, u est combinaison linéaire de u’ 
et u2 donc tout vecteur de V est combinaison linéaire de u',u2,...un. [| 


Nous allons voir que par les opérations (a), (b) et (c}, on peut transformer les vecteurs 


U],..., Un en une suite échelonnée. 
ai 
Considérons un vecteur u — | : | et supposons que sa k-ième coordonnée ax est 
bi d 
non nulle. Si u— | : | est un vecteur quelconque, le vecteur v’=v—(b4/ax;)u a pour 
bp 


k-ième coordonnée by — (b;/ax)ax — 0 et s'obtient à partir de u,v par l'opération (c). 
Supposons par exemple que la première coordonnée de u1 n’est pas nulle. En ajou- 
tant à chacun des vecteurs u2,...,u, un multiple convenable de uw, on peut ainsi 
obtenir des vecteurs u,...,u!, dont la première coordonnée est nulle. En poursuivant 
ces opérations, on formera des vecteurs en échelon. 


Exemple. Échelonnons la suite de vecteurs 


2 3 1 —2 

—1 1 4 

ui — | ; U2 — if > U3 — 1 ; Ua — 1 
3 4 2 1 


Étape 1. En ajoutant 3u, à —2u2 (opérations (b} et [c}), on obtient le vecteur u, = 


H HN © 


dont la première coordonnée est nulle; de même, en posant u, — 2u3 — ui et 
uh = Ua + U, il vient 


2 0 0 0 
| ile uw = |2 a 
a à 2 — | 7 3 |1 LE 19 
3 1 1 4 
Étape 2. Soustrayons u, à ul, et 2u, à u!, : on trouve la suite de vecteurs 
2 0 0 0 
2 
ui = : a 1 — : à UÙ =Ù4 — Duo = | 
3 1 0 2 


et les vecteurs w1,u’,u sont échelonnés. 
Soit V le sous-espace vectoriel de R{ engendré par u:,uo,u3,u4. D'après la proposition, 
V est aussi engendré par u1,u,uï,uï, c'est-à-dire par w,u,,u\ puisque us = 0. 
Les trois vecteurs u1,u»,u étant échelonnés, ils sont indépendants : les vecteurs 
w,u,,uj forment donc une base de V. Par conséquent, on a dim V = 3. 
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Résumé des méthodes pour trouver une base 
Soit V un sous-espace vectoriel. 


Si l’on connaît des vecteurs uj1,u2,...,uA qui engendrent V, alors en échelon- 
nant ces vecteurs, on obtient une base de V. On trouvera au plus n vecteurs en 
échelons, donc la dimension de V est inférieure ou égale à n. 

— Si V est l’ensemble des solutions d’un système linéaire homogène à n inconnues, 
on résout ce système par la méthode de Gauss : si le système est de rang r, les 
solutions s'expriment de manière unique comme combinaison de n—r vecteurs 
indépendants qui forment donc une base de V : dimV = n-r. 


3.4 Propriétés de la dimension 


Propriétés 1. Soit V un sous-espace vectoriel de KP. 
a) Si V est engendré par n vecteurs, alors dim V < n. 
b) Si ui, u2,...,u, sont des vecteurs indépendants appartenant à V, alors q < dim V. 


c) Supposons que V est contenu dans un sous-espace vectoriel W de K?. Alors on a 
dim V <dimW et de plus, on a V=W si et seulement si dim V = dimW. 


Démonstration. Posons d = dim V et soit e1,e2,...,e4 une base de V. 

(a) Si l’on échelonne une suite de n vecteurs qui engendrent V, on obtient une base formée 
d’au plus n vecteurs en échelons, donc la dimension de V est inférieure ou égale à n. 

(b) Chaque vecteur u; est combinaison des vecteurs indépendants e:,...,e4. Si l’on avait g>d, 
alors d’après la proposition page 115, les vecteurs u1,...,u, ne seraient pas indépendants. 
Par conséquent, on a q < d. 

(c) Les vecteurs e1,...,e4 appartiennent à V donc à W, et ils sont indépendants. D'après 
la propriété (b}, on a donc d £ dimW. Supposons d = dimW et montrons que tout vecteur 
u € W appartient à V : puisqu'on a aussi V C W, cela impliquera l'égalité V = W. Rai- 
sonnons par l'absurde en supposant qu'il existe un vecteur w € W tel que w & V. Alors les 
vecteurs €1,62,...,e4,w sont deux à deux différents, donc leur nombre est 1+d—=1+dimW. 
Puisqu'ils appartiennent au sous-espace W de dimension d, ils ne sont pas indépendants 
(d’après (b]}). On en déduit (théorème page 105) que w est combinaison linéaire de e1,...,ea, 
ce qui est contraire à l'hypothèse. = 


Propriétés 2. Soit V un sous-espace vectoriel de K? de dimension d. 
a) Si u,U2,...,u4 sont des vecteurs indépendants appartenant à V,, ils forment une base de V. 
b) Si wi, u2,...,ua sont des vecteurs qui engendrent V, ils forment une base de V. 


Démonstration. Soit V' le sous-espace vectoriel engendré par u1,u2,...,u4. Puisque les 
vecteurs u; appartiennent à V, tout vecteur de V” est un vecteur de V, autrement dit on a 
l'inclusion V’ C V. Si les vecteurs u1,u2,...,u4 sont indépendants, ils forment une base de 
V”, donc on a dimV”’= 4, c'est-à-dire dim V” = dim V. D’après la propriété 1(c}, on en déduit 
V = V7’. Donc w1,u2,...,u4 est une base de V. 

Supposons maintenant que les vecteurs u1,u2,...,u4 engendrent V. S'ils ne sont pas indépen- 


dants, l’un d’eux, ua par exemple, est combinaison linéaire des autres. Alors V est engendré 
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par les vecteurs u,u2,...,u4-_1. Par la propriété 1(a), on en déduit dimV < d—1, ce qui est 
une contradiction. Ce raisonnement montre que les vecteurs uw1,u2,...,ua sont indépendants. 
Puisqu'ils engendrent V, ils forment une base de V. = 


Propriété 3. Si V est le sous-espace vectoriel de K? engendré par des vecteurs 
ui, U),..., Un, la dimension de V est égale au rang de l'équation linéaire 
TU + Tou2 + + + Tnün = 0. 


Démonstration. Notons r le rang de l'équation. Si r — n, cette équation homogène a pour 
unique solution æ1 = -:: =, = 0 (résultat 2 page 114), donc les vecteurs w1,u2,...,u, sont 
indépendants et l’on a bien dimV=n=r. 

Supposons maintenant 1 <r < n. Supposons que, par la méthode de Gauss, on commence 
par éliminer +1 dans la deuxième équation du système. On obtient une équation linéaire 
Ti + Too +--- + zur = 0, où l’on est passé d’un vecteur u; quelconque au vecteur ü; en 
faisant sur les coordonnées la même opération : 


a 1 
@2 +tar 
2 
siu—= | . est l’un des vecteurs u;, le vecteur à correspondant est de la forme a3 ; 
; : 
p 
dp 


et le scalaire {, choisi pour que la deuxième coordonnée de w soit nulle, est le même pour 
tous les vecteurs u;. Si l’on applique cette opération à un vecteur quelconque de K?, cela 
définit une transformation u + à de KP. Le transformé de au est œù, le transformé de 
u + v est à + à et le transformé du vecteur nul est le vecteur nul. 


Pour simplifier, supposons que la méthode de Gauss appliquée à l'équation 
Ti +Tou2+ - -: +Touüun = 0 


conduise au système linéaire équivalent 


/ / / / / _ 
Li + Q12T2 + Qal3 + + Gi Er + ip Ertt + tt + Ainln = 0 
! ! / po. 
; T2 + Q93T3 + ++ + Go, Tr + Goya Lrtt + + + Aonn = 0 
(s”) 
! / nr. 
Tr + Grp41lr41 + + Gynln = 0 


(le système étant homogène, les égalités de compatibilité sont satisfaites.) Ce système s'écrit 
aussi æju! +æou, +--:+xnu!, = 0, où 


1 a! / / / 
: É ir a r+1 Ain 
0 0 A2r A2 +1 An 

ER 5 = } ARE ! _… £ =, 1 
Us — 0 > U = 0 ; » Ur — 1 Uri — LAPS] Un — [an 
0 0 0 0 s 

0 0 0 0 0 


On passe des u; aux u! par des opérations du même type que pour la transformation ur à ; 
précisément, on effectue la même suite d'opérations sur tous les vecteurs, une opération 
élémentaire étant l’une des suivantes : 


CHAPITRE 4 - ÉQUATIONS LINÉAIRES ET VECTEURS - 121 


i) changer l’ordre des coordonnées, 

ü) multiplier une coordonnée par un scalaire non nul, 

ii) ajouter à l’une des coordonnées un multiple d’une autre coordonnée. 

Pour tout vecteur u € KP, notons uw’ le vecteur obtenu après cette suite d'opérations : cela défi- 
nit une transformation u+- u’ de K?. Le transformé de au est au’, le transformé de u + v est 
u'+v' et le transformé du vecteur nul est le vecteur nul. De plus, on peut retrouver w à partir 
de uw’ par une suite d'opérations du même type, donc la transformation u + u! est bijective. 


Montrons que les vecteurs u1,u2,...,u- sont indépendants. Supposons qu’on a une rela- 
tion Yi + Yous +: +yu, = 0; alors en transformant chaque membre de l'égalité, il vient 
yiu, + you, +--.: + yrul. = 0; les vecteurs u\,u,,...,u} étant visiblement indépendants (ils 
sont échelonnés par le bas), les scalaires y1,y2,...,y. sont tous nuls. 
Montrons que pour r +1<k<n, le vecteur ux; est combinaison linéaire de u;,u2,...,u,. 
Le système d'équations aux inconnues {1,t2,...,tr : 
/ / / 7 
li + @iote + Qists + Æaitr = Gi 
! ! ! 
la + Qogtz + 2 + Qortr = Go 
= ! 
tr — Ark 
possède r équations, r inconnues et est de rang r, donc il a une unique solution (#1,42,...,t,). 


On a, dans K”, l'égalité de vecteurs 


1 a! 0 

0 or au 
/ 

0 or dk 


ti bill dés . | = 


0 0 : Grk 
et comme les p —r dernières coordonnées des vecteurs u! sont nulles, on a aussi 
! / d ! 
Liu + tou + +UU, = Uy. 


Puisque la transformation ur u’ est une bijection, on en déduit tiu1 +touo +---+tu, = uk : 


chaque ux est donc combinaison de u1,...,u,. Ainsi le sous-espace vectoriel V engendré 
par Ui,u2,...,u est aussi engendré par les vecteurs indépendants u1,...,u,, donc V est de 
dimension r. = 


Un exemple d'application 


Dans l’un de ses secteurs de production, une entreprise fabrique quatre sortes de fils 


synthétiques fi, f2, fs, fa, essentiellement à partir de deux 
5 : fi| 2] fs | Ja 
matières premières M et M". Dans le tableau ci-contre, les 


chiffres indiquent le pourcentage de M et le pourcentage 


M'|10 | 30 | 10 | 50 


de M rentrant dans la composition de chaque fil. 
Notons q; le nombre d'unités de fil f; produit chaque jour. Une production journalière 
est ainsi caractérisée par le vecteur (q1,g2,q3,q4). Cherchons les vecteurs de production 
qu'on peut obtenir à partir de quantités x et y des matières premières M et M. 
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Les équations. Le fil f\ utilise 40% de M et 10% de M’, donc le nombre d’uni- 
tés de fil f, produite est q1 — (4/10)x + (1/10)y. En raisonnant de même pour les 
autres fils, on obtient les égalités 


)x + (1/10)y = qi 
(S) (3/10)x + (3/10)y = q 
(1/10)x + (1/10)y = q3 
(2/10)x + (5/10)y = qu 
Ce système d'équations est équivalent à : 
(4/10)x+(1/10)y=q (4/10)x+(1/10)y=q 
(9/10)y=4g—3q (9/10)y=4g —3q 
(3/10)y= 493 — qu 0—3(4q5 — qi) — (4q — 3q) 
(9/10)y=2q — qu O=(2q1 — qi) — (492 —3q) 
(4/10)x+(1/10)1y= qu (4/10)z=q1 —(4/9)g2+ (1/3) 
— (9/10)y=—4q2 —3q = d (9/10)y=49 —3q 
0—3q3 — q 0=3q3 — q2 
0=2q1 — 4qo +2q4 0= qi —2q92+q 


(1/10)x = (3q1 — g2)/9 
(9/10)y = 4go — 34 

0 — 3q3 — qu 

0 = qi — 2qo + qa 
Les quantités x, y, qi, g, q3 et ga devant être positives ou nulles, les conditions de 
production sont : 

34 2q 20 / 3q3 — q2 
(C) — 69 ve D 

D'après (C"), qi et g> déterminent q3 et qg1. Si les conditions (C') sont satisfaites, 
alors 24 > (3/2)qi et l’on a bien qa = 2q2 — qi > (3/2)qi — qi = (1/2)m > 0. 
Un vecteur de production est donc déterminé par q1 et g, pourvu que ces quantités 
vérifient (C). Les variables qi et g sont des variables de contrôle. Pour des valeurs 
données de q1 et g», les quantités x et y de matières premières nécessaires à la 


c'est-à-dire à : (5) 


production se calculent au moyen des deux premières égalités de (5). 

Le vecteur de production (q1,q2,gq3,q1) = (3,3,1,4) est irréalisable, car la seconde 
égalité de (C”) n’est pas satisfaite. 

Le vecteur (q1,q2,q3,q1)=(3,3,1,3) s'obtient avec les quantités de matières premières 
x = 20/3 et y = 10/3. 


Représentation graphique. Sur le graphique ci-contre, 
on a porté qg en abscisse, g en ordonnée, et l’on a repré- 
senté la droite d’équation g> — 3q1 — 0 et la droite d’équation 
Aq2 — 3q = 0. La partie grisée représente les couples (q1,q2) 
possibles. 
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Une contrainte supplémentaire. Pour des raisons commerciales, l’entreprise 
veut limiter à trois unités la production du fil f1. On doit donc avoir 242 — qi =qa<3, 
c'est-à-dire g><(1/2)q1+3/2. En ajoutant au gra- 
phique la droite d’équation 2q2 — gi = 3, on voit 
que les couples (g1,q) possibles sont mainte- 
nant dans le triangle OAB représenté ci-contre. 
Les coordonnées du point À sont déterminées 
par les équations go = 3q1 = (1/2)q1 + 3/2, d'où 
(5/2)q — 3/2, qi = 3/5 et qo — 9/5. Les co- 
ordonnées du point B sont données par q» — 
(3/4)g=(1/2)a+3/2, donc (1/4)q=3/2, a =6 
et g2 = 9/2. 
A:(3/5,9/5) , B:(6,9/2) 


Un problème d'optimisation. On demande en plus à l’entreprise de fournir un 
fil composite f constitué avec fr, f: et f1 et comportant 50% de f1. Il est décidé de 
consacrer à cette production la moitié de la quantité q3 et un tiers de q4. Le béné- 
fice attendu concerne principalement la quantité du fil f: rentrant dans la nouvelle 
fabrication : l’entreprise cherche donc à rendre maximum cette quantité. Comment 


doit-elle ajuster les variables de contrôle qi et q2? 


Notons q la quantité de fil f utilisée dans la nouvelle fabrication. On doit avoir 


l'égalité n = : + q donc il s'agit de rendre maximum la quantité 
_Lu_S 
Ru: 


Exprimons q en fonction des variables de contrôle q et g. D’après (C”), il vient 


2qa — 3q3 — 2(2q2 — qi) — go — 3g2 — 2, donc 
(1) 6q = 3q2 — 2q1. 
Rappelons que les variables q; et qg2 satisfont aux inégalités : 


(2) er < E < 341 


æ < (1/2)a + 3/2 
qui expriment que le point de coordonnées (q1,q) est dans le triangle OAB. 


Dans le repère des variables (q1,q), dessinons les droites d'équation 3q2 — 2q1 = a, 


où a est un nombre quelconque. Ces droites ayant toutes la même pente 2/3, elles 
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sont parallèles ; l’ordonnée à l’origine (obtenue pour qi = 0) est a/3. 


q2 À 


> 


5 qi 


oi 


o1 : qi OÙ 1 3 $ à 


La droite d'équation 3q> — 2q1 — 6q est l’une de ces droites et elle doit contenir des 
points du triangle OAB. La pente 2/3 étant comprise entre la pente de AB (qui vaut 
1/2) et celle de OA (qui vaut 3), c'est pour la droite passant par A que q est maximum. 
Cherchons l'équation de cette droite. Les coordonnées de A sont (3/5,9/5), donc 
6q = 3(9/5) —2(3/5) — 7(3/5) et q — 7/10. L'équation de la droite optimum est donc 
3q2 — 24 — 6(7/10), ou encore q> = (2/3)q1 + 7/5. Pour assurer cette production, il 
faut que q1 — 3/5 et que go — 9/5. Il vient alors q3 — g>/3 — 3/5 et qa = 2qo — qi — 3. 
Les quantités utilisées pour fabriquer le fil f sont 

pour f1: qa/3 = 1, 

pour f3 : 43/2 = 3/10, 


— pour f2 : q — 7/10. La proportion de fil f» consacrée à la production de f est 
Hu be ae 
4 109 18’ soit un peu plus de 38,8%. 


a Exercices emmmmmmmx 


1. On considère le système d'équations du pont de Wheatstone, page 104. 
a) Montrer que l'intensité à; est nulle si et seulement si rir3 = rora. 


b) On suppose r1 = r3 = r4 = 20 et r2 = 1Q. Calculer les intensités (en ampère) en 
fonction de e (exprimé en volt) et de r;. On suppose e = 12V et l’on fait varier 


r; d’une valeur très petite à une valeur très grande. Entre quelles bornes varie 
l'intensité dans le générateur ? 


@ 2.On cherche une courbe polynomiale æ+- P(x) de degré au plus 3 passant 
au point A; = (#,y1) avec une pente p1 et au point A2 — (x2,y) avec une 
pente p2 (on suppose 2x1 # x2). Cherchons le polynôme P sous la forme 
P(x)=al[(x-m)/(x-)+(2-21)(x-22)7)]| +b(r-2)(x—x2)+c(x-21)+d(x-22), 
où à, b,c,d sont des coefficients à calculer. 


a) Écrire les quatre équations vérifiées par à, b, c,d. 
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b) Exprimer a,b,c,d au moyen de %1,%2,y1,Y2, Pi, po. 


c) On suppose x, = y1 = 0, pi —5, ï2a — 3, Yi — 2 et p2 — 0. Dessiner la courbe 
d’équation y — P(x) sur l'intervalle [x:, x]. 


2z+y+z-t=1l 


3. Résoudre le système d'équations linéaires { ss el 


Li —L2+T3—-%X1—=0Q 
4. Résoudre le système d'équations linéaires T1 + Lo + 3 + x4 = b 
T1 + 229 + T3 + 224 = C 


di + 23 + 4x4 + 4t5 = à 
@ 5. On considère le système d'équations linéaires 4 21 + %o + 273 + 2%4 + 2x5 = b 
Xi + 2%9 + MX = C 


a) Quel est le rang du système ? (discuter selon la valeur de m) 
b) Pour quels nombres m ce système possède-t-il des solutions quels que soient à,b,c ? 


c) Résoudre le système en discutant selon les valeurs de a,b,c,m. 


y+z+t=0 
T—y+z-t—=0 
x —2y—2t—0 
æ+2z=0 


@ 6. Soit V le sous-espace vectoriel de R‘ défini par les équations (5) 


a) Trouver un système d'équations définissant V et comportant le nombre minimum 
d'équations. Quel est le rang du système (5) ? 


b) Trouver une base de V. Quelle est la dimension de V ? 


@ 7. Trouver une base du sous-espace vectoriel de R‘ engendré par les vecteurs (0,1,2,1), 
(1,—1,1,—1), (a,0,3,0), (1,1,5,1) (discuter selon les valeurs de a). 


@ 8. Posons u —(0,1,2,3) et u—(3,2,1,0). Soit V l’ensemble des vecteurs (x,y,z,t) € R‘ 
de la forme au + bv, où a et b parcourent les nombres réels. 


a) Montrer que V est un sous-espace vectoriel de R‘. Quelle est sa dimension ? 


b) Trouver des équations de V. 

æ—y+2z—]l 
z+y+z=l 

plan affine contenant D et passant par le point de coordonnées (a, a, a). 


@ 9.Soit D la droite affine de R° d'équations { . Trouver l'équation du 


@ 10. Soit V le plan vectoriel de R° ayant pour base (1,1,1),(1,0,2). Quelle est l'équation 
du plan affine passant par le point À = (1,2,1) et de direction V ? 
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@ 11. Un exemple de systèmes à solutions positives. Considérons un système de n équations 


linéaires à n inconnues, de la forme 


QT — d2T2 — A13T3 de — dinln = di 
— QT] + Q22T2 — Q23L3 — née — Gnln = Vo 
QAn1Ti An2X2 He Ann-12n-1 + AnnTn = bn 


Faisons les deux hypothèses suivantes : 


1)les nombres a;; et les nombres b; sont tous positifs ou nuls (ainsi les coefficients 
diagonaux sont positifs, les autres sont négatifs et le second membre est positif) ; 


2) pour tout à — 1,2,...n, on à &ÿ co. 


Ji 
Un tel système est à diagonale strictement dominante. Le but de l'exercice est de mon- 
trer que si (x1,%2,...,4,) est solution, les nombres x; sont tous positifs ou nuls. 


Nous verrons aussi page 250 qu'un système vérifiant (1) et (2) possède une unique 

solution. 

a) On suppose n — 2. Montrer qu'il y a une unique solution (x1,%2) et que l’on a 
x 2 0 et x 2 0. 

b) On suppose n = 3. Soit (z1,%2,%3) une solution. Supposons par exemple que le 
plus grand des nombres |x1|,|x2|,|[x2| est [x2}, donc on a |x2| > [x1l et [ro] > [x]. 
{ Montrer que |a21%1 + a23t3| < ax] ; en déduire que —a21%1 + a22%2 — a23%3 a 
le signe de a»x2 et que x2 est positif ou nul. 


ati — a3t3 2 0 
— a31T1 + 43373 Z 0 
que x, et x3 sont positifs ou nuls. 
li) Expliquer pourquoi le résultat est vrai quelle que soit la disposition des nombres 
rit lol, al. 


ii) Montrer que l’on a . En utilisant le résultat (a), en déduire 


c) Expliquer le raisonnement par récurrence qui permet de démontrer le résultat pour 
un système de n équations. 
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Chapitre 5 


Matrices 
et déterminants 


1. Matrices 


Rappelons que K désigne l’ensemble des nombres réels ou l’ensemble des nombres 
complexes. 


1.1 Définitions et opérations sur les matrices 


Définition 
Un tableau formé de nombres appartenant à K s'appelle une matrice à coefficients 
dans K. 


Voici une matrice À à deux lignes et trois colonnes et une matrice B à deux lignes 
et deux colonnes : 5 
a at à B = Ë u | 


L'ensemble des matrices à p lignes et n colonnes se note #4, .(K). Une matrice ayant 
autant de lignes que de colonnes est dite carrée; l'ensemble des matrices carrées à n 
lignes et n colonnes se note simplement 4, (K). 


Une matrice-ligne est une matrice à une seule ligne, comme [ai @2 **- n | ; l'ensemble 
des matrices-ligne à n colonnes est donc #{1,(K). 
ai 
Nous avons déjà rencontré les matrices-colonne | : | à p lignes : ce sont les éléments 
de A1 (KR). @p 
Siu=(ai,a2,...,a,) est un vecteur de K?, alors en disposant les coordonnées de u en 
ai 
colonne, on obtient la matrice-colonne : | ; en disposant les coordonnées en ligne, 
dp 
on obtient la matrice-ligne [as +: a, ]. C’est pourquoi on dit aussi « vecteur-colonne » 


au lieu de « matrice-colonne », et « vecteur-ligne » au lieu de « matrice-ligne ». 
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N 


Pour définir une matrice générale à p lignes et n colonnes, on utilise deux indices 
pour les coefficients : 


@i1 12 °°" Ain 

@21 22 *‘°' An 
À = | . 

Qpl Gp2 F2 Gpn 


Le premier indice est le numéro de la ligne, le second est le numéro de la colonne. 
La matrice ci-dessus se note aussi À = [a;;]. 


Lignes et colonnes d'une matrice 


U2R) 
2j 
— Si j est l'indice d’une colonne, la matrice-colonne A;—| . | s'appelle la j-ème co- 
Gpj 
lonne de À. Pour mettre en évidence les colonnes de À, on note A=[ A; 42 --. À, |. 
- De même, si à est l'indice d’une ligne, la matrice-ligne L; = [ai ais ++: ain] 
L 
Li 
s'appelle la i-ème ligne de À et l’on pourra noter À — 
L 


— Une matrice [a] qui n’a qu’une seule ligne et qu’une seule colonne est identifiée 
au scalaire &. 


Définition 

Si A={a;;] est une matrice carrée, les coefficients a;; s'appellent les coefficients dia- 
gonaux de A. Une matrice carrée dont tous les coefficients non diagonaux sont nuls 
s'appelle une matrice diagonale. On note diag(a1,a2,...,an) la matrice diagonale 
dont les coefficients diagonaux sont &1,...,an. 


0 0 
b 0 
0 c 


Ainsi par exemple, on a diag(a,b,c) = | 


OQR 


Produit d'une matrice par un scalaire 


Pour multiplier une matrice À par un nombre {, on multiplie tous les coefficients 
par t:si A=/{[a;;], on a donc {A = [ta;;]. 


Somme de deux matrices 

Soient A= fa;;] et B=[b;;] des matrices de même taille. On définit la matrice A+ B 
en ajoutant coefficient par coefficient, autrement dit le coefficient d'indices i,j dans 
la matrice À + B est a;j +b;;. La matrice À + B est de même taille que À et B. 
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Ces deux opérations permettent de définir des combinaisons linéaires de matrices de 


même taille. 


Définition 
Soient A1,4»,...,A% des matrices à p lignes et n colonnes. Une combinaison linéaire 
des matrices A1, 4,..., Ay est une matrice de la forme 
hi + BAFA, 
où t1,42,...,t, sont des scalaires. C’est encore une matrice à p lignes et n colonnes. 


Pour des matrices-colonnes à p lignes, on retrouve la notion de combinaison linéaire 


de vecteurs de K?. 


Exemple. On a 2[ÿ b c|-3[È U il=| 2a 2b—3v —3w 


0 b' c! uv 0 —3u! 20 — 3v' 2€ |’ 


Transposée d'une matrice 


Définitions a 
— La transposée de la matrice-colonne À = | : | est la matrice-ligne [ai --: &] 
et se note ‘A. y 
Soit À une matrice ayant n colonnes A;,42,...,A,. La matrice transposée de À, 
notée ‘À, est la matrice dont les lignes sont !A1,!42,...,tA4,. 
a a 
Exemple. La transposée de la matrice À = [a : | est la matrice *A = | b y | | 
C C 


Si AE Myn(K), alors A € Mn p(K). Pour tous indices à et j, le coefficient situé en 
i-ème ligne, j-ème colonne de À se trouve en j-ème ligne, i-ème colonne de ‘A. Si 
A= [a;;], on a donc ‘A = [a;;] et l'égalité {(*A) = À. 

Si À est une matrice carrée, ‘A s'obtient en faisant une symétrie par rapport à la 


diagonale de À (c'est-à-dire la droite constituée des coefficients diagonaux). 


Lorsqu'on a l'égalité A — ‘À, on dit que la matrice À est symétrique. 


Produit de matrices 

Si À et B sont des matrices, le produit AB est défini seulement à la condition que 
le nombre de colonnes de À soit égal au nombre de lignes de B. 

Procédons par étapes pour définir le produit matriciel AB. L'opération de base est 


le produit d’une ligne par une colonne. 
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A est une matrice-ligne et B_est une matrice-colonne 


b: 

2 
Supposons À — [ai a --: a,] et B— | . | (ces matrices ayant le même nombre 
n de coefficients). On pose b 

nm 


b: 
bo 

AB = [a a. an]! . | = a1b1 + a2bo ++: + anbn. 
4 


A est quelconque et B_est une matrice-colonne pi 
2 
Supposons que A = [a;;] possède p lignes et n colonnes et que B=|.|an 
bn 


lignes. Pour tout indice à compris entre 1 et p, notons L; la i-ème ligne de À. Le 


produit matriciel L;B est bien défini et vaut 
LB = ab + @2b2 + +: + ainn . 


On définit le produit AB de la manière suivante. 


LB 
Li LB 

La matrice produit AB — B est la matrice-colonne : 
L L,B 


Le produit AB a autant de lignes que À. 


A possède n colonnes et B possède n lignes 


Appelons Ci,C:,---,C, les colonnes de B. Pour tout indice j compris entre 1 et 
q, le produit matriciel AC; est bien défini : c’est une matrice-colonne ayant autant 


de lignes que À. 
Définition 
Le produit AB = A[C --: C;] est la matrice [ AC AC: --:+ AC, |. Le produit 
AB a autant de colonnes que B et autant de lignes que À. 


Si AE Myn(K) et si BE My,g(K), alors le produit AB appartient à #4, 4(K). 


Exemples 
1 

- Le produit [a b c] H = [a + 2b + 3c] s'identifie au scalaire a + 2b+3c € K. 
3 
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x x 
Le produit M=| ù s | H est la matrice-colonne he avec mu—|a b c|| y 
z z 
: b 
ax + by + cz et ma =[a b c]|y|=ax+by+cz. On a donc E b s | y | = 
z 


Z 
ax + by + cz 
ax +by+cz | 


L 2 ; 
 Posons À — L =1 = () et C= [7 À]. 11 vient 
—1 1 
zx +2y LE 21 t+2y 2+2t 
AB= | x-y et AC = 1 —1 | | - x—y z2—t|, 
—T+Yy —1 1 y t —T+y —-2+1 


mais les produit BA et CA ne sont pas définis. 


Produit de matrices carrées de même taille. Pour toutes matrices carrées A 


et B à n lignes et n colonnes, le produit AB est défini et c’est une matrice carrée 
& | a llfbcl [ab ac+b 
à n lignes et n colonnes. On a par exemple L à Ë e| = | = à |. 


Voici une proposition simple et commode qui résulte immédiatement de la définition 
du produit matriciel. 


Proposition. Soit A une matrice à p lignes et n colonnes. Si les colonnes de 


T1 

T2 
A sont A;,4,...,A4,, alors pour tout vecteur-colonne X = | . |, on a AX = 
T1 A1 + To A2 +: + TnAn. " 

nm 


Sélection d'une colonne ou d'une ligne. Rappelons que pour tout j€{1,...,n}, 
on note e; le vecteur canonique de K” dont tous les coefficients sont nuls sauf le 
j-ème qui vaut 1 et que Æ; désigne le vecteur-colonne correspondant (voir page 
102). D'après la proposition précédente, 

si À est une matrice à p lignes et n colonnes, alors pour tout jE{1,2....,n}, 

le produit AË; est la j-ème colonne de A. 


De même, si à est un indice entre 1 et p, la matrice tE; est une matrice-ligne et le 
produit (*E;)A est la i-ème ligne de À. 

Dans une matrice, on peut donc sélectionner la colonne j en multipliant à droite par 
E; et l’on peut sélectionner la ligne à en multipliant à gauche par E;. 


Définition ii 
Pour tout entier n>1,on note 1, = |. . . | la matrice diagonale diag(1,1,...,1) 
OÙ +41 

à n lignes et n colonnes. Cette matrice s'appelle la matrice unité de A, (K). 
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Corollaire. Si À est une matrice à p lignes et n colonnes, alors on a AI, = A et 1, A= A. 


Démonstration. La j-ème colonne de /, est E; € A, 1(K), donc par définition du produit 
de matrices, on a Al, =[AE; AE --: AE, |. Puisque AE; est la j-ième colonne de 4, 
les matrices Al, et A ont les mêmes colonnes. On montre de même l'égalité 7, A = À en 
remarquant que les lignes de JZ, sont les matrices *E;. = 


1.2 Règles du calcul matriciel 


On calcule évidemment sur les combinaisons linéaires de matrices comme sur les 
combinaisons linéaires de vecteurs. Concernant le produit de matrices, on a les règles 
suivantes. 

1 A(B+C) = AB+AC et (A+B)C = AC + BC. 

ISi À€EK, alors A(AB) = ÀAB = (XA)B. 

il) A(BC) = (AB)C et cette matrice se note simplement ABC. 

M (AB) = (B)(ÀA). 


Il résulte des propriétés {I} et (Il) que si AE 4, (K) et si B1,B2,...,Bx sont des 
matrices de #,, 4(K), alors pour tous scalaires 21,%2,...,4%, on a dans 4, 4(K) 
l'égalité de matrices 


A(x1B1 + 2oBo +. + xpBr) = m1 AB: + 22 AB2 +: +24 ABx. 
— La matrice de 4, .(K) dont tous les coefficients sont nuls s'appelle la matrice nulle 


et se note simplement 0. Pour toute matrice AE, ,(K), on a A+0=0+A=A 
et si l’on multiplie une matrice par la matrice nulle, on obtient la matrice nulle. 


Produit de matrices carrées. Le produit de deux matrices carrées de même 
taille est une matrice carrée de même taille : le produit de matrices est donc une 
opération dans l’ensemble .#,(K). 

Si À est une matrice carrée de taille n, on peut définir son carré AA = A2, son cube 
A4? = A et de proche en proche, pour tout entier k > 2, sa puissance k-ème A, 
en posant AË = AAË-1, De plus, on pose A! = A et A1 = 1,. 


Polynôme en une matrice. Soit P=arz"+ag 12" 1+.. -+a12+a un polynôme 
à coefficients dans K. Pour toute matrice À € .AÆ,(K), on définit la matrice 

P(A) = GAS Ge 4 et A tot, 
qui appartient à .W,,(K). 


Particularités du produit matriciel 


Nous avons vu que le produit de deux matrices n’est défini que si le nombre de 
colonnes de la première est égal au nombre de lignes de la seconde. Voici d’autres 
particularités du produit matriciel. 
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L'ordre des facteurs compte. Soient AE, .(K) et BEM» »(K). Le produit AB est 
défini : c'est une matrice carrée de taille p ; et le produit BA est défini : c'est une matrice 
carrée de taille n. Si p  n, les matrices AB et BA ne sont évidemment pas égales. 
Mais même en supposant que À et B sont des matrices carrées (p = n), le produit 
AB n'est en général pas égal à BA : le produit des matrices n’est pas commutatif. 


11 1 
11 1 


a8=[1 1011-08 e s4-[} HI e(3 2] 


En fin de paragraphe, nous mentionnons les principaux cas particuliers où l’ordre 
des facteurs ne compte pas. 


Exemple. Posons À — | | et B = | Al: On a 


Un produit de facteurs non nuls peut être nul. Autrement dit, si À et B sont des 
matrices, on peut avoir AZ0, B2Æ0 et AB =0. Par exemple, les matrices À et B de 
l'exemple précédent sont toutes deux non nulles et le produit AB est la matrice nulle. 


: = [OL] . 2_[01]1[01| 
Comme autre exemple, prenons la matrice N — È ‘| :ona N°— Ë | É | = (. 


Dans une égalité, on ne peut pas toujours simplifier par un facteur non nul. 
C'est une conséquence de ce qui précède : supposons que À et B sont des matrices 
non nulles telles que AB = 0, c'est-à-dire AB = 0B; si l’on pouvait simplifier par 
B dans cette égalité, alors on aurait À — 0, ce qui n’est pas vrai. 


= Qi À _ 21 _ [it 211 [11 
Exemple. Posons A=[ | et B= É G |: On a AB = Ë 1] LE | = Ë ik 
donc AB = À. Cette égalité s'écrit AB = Al>, mais B n’est pas égal à l2 : on ne 


peut pas simplifier par À. 
Nous verrons bientôt une condition permettant de faire ces simplifications. 


Matrices qui commutent. Si des matrices carrées À et B de A, (K) vérifient 
AB = BA, on dit qu’elles commutent. Voici des exemples de matrices qui commutent. 


Pour des matrices diagonales, on a l'égalité 
diag(a1,...,an) diag(b1,...,bn) — diag(aibi1,...,anb). 
Il s'ensuit que si D et D’ sont des matrices diagonales, alors DD' = D'D. 
Pour tout scalaire À, la matrice À, = diag(\, À,..., À) commute avec toute autre 
matrice carrée À de taille n. 
En effet, puisque A7, =1, A= A, on a A(\,)=A(AI,)=XA et (A,)A= (1, A)=XAÀ, 
d’après les règles de calcul. 
Une matrice AE.W,(K) commute évidemment avec toutes ses puissances 4}, donc 


aussi avec une matrice P(A), où P est un polynôme à coefficients dans K. On en dé- 
duit que si P et Q sont des polynômes, alors les matrices P(A) et Q(A) commutent. 
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Concernant la somme et le produit, les règles de calcul pour les polynômes en la 
matrice À sont les mêmes que pour les polynômes. On en déduit que pour tous 
polynômes P et Q, on a P(A)Q(A) = (PQ)(A), où PQ est le polynôme produit. 
Ainsi par exemple, si P = (2z—1)F et si À € M, (K), alors P(A) = (2A — 1, )F. 

Pour des matrices qui commutent, on a aussi la formule du binôme comme pour les 

nombres. 


Formule du binôme de Newton. Soient À et B des matrices carrées de même 
taille. Si les matrices À et B commutent, alors pour tout entier k > 2, on a 


k k Di k ; 
i e— 
1.3 Matrices et systèmes linéaires 
Considérons le système linéaire 
Qt + 22 + +: + Gintn = bi 
Q21T1 + G9229 + +++ + QonEn — V2 
ApiTi + Ap2T22 + * + + ApnEn = Dp 
aux n inconnues %1,...,%,. La matrice du système est par définition la matrice des 
coefficients du premier membre, c'est-à-dire 
Q11 @12 °°° Ain 
G21 92 °° An 
A= |. 
Gp1i 422 ‘°° Apn 
T1 bi 
Lo bo 
Posons X = | . | et B— | . |. Alors d’après la proposition page 133, le système 
En D 
s'écrit simplement 
AX = B. 


Formulons dans le cadre des matrices quelques-uns des résultats obtenus au chapitre 
précédent. Commençons par un résultat simple et fondamental. 


Proposition. Si X, est une solution du système linéaire AX = B, alors les solutions 
sont les vecteurs X = X9 + U, où U est solution du système linéaire AX = 0. 


Démonstration. Supposons AX5=B. Pour tout vecteur-colonne X€K”, on a les équivalences 
AX = B AX = AX5 AX — AXo = 0 


A(X — Xo) = 0 X = Xo+U, où U vérifie AU = 0. a 
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Rappelons que les solutions du système linéaire AX — 0 forment un sous-espace 
vectoriel de K” de dimension n — r, où r est le rang du système (page 116). 


Définition 
Soit À une matrice à p lignes et n colonnes. Le rang du système linéaire AX = 0 
s'appelle le rang de À et se note rg À. 


Lorsqu'on résout un système linéaire par la méthode de Gauss, on pratique sur les co- 
efficients des équations les opérations qui permettent d’échelonner les vecteurs-ligne 
de la matrice du système. À la fin, on obtient r vecteurs-ligne indépendants, où r 
est le rang du système. Puisque r vecteurs indépendants engendrent un sous-espace 
vectoriel de dimension r, on en déduit : 

le rang d'une matrice est la dimension du sous-espace vectoriel 

engendré par les vecteurs-ligne. 


D'après la propriété 3 page 121, on a aussi le théorème fondamental suivant. 


Théorème. Le rang d'une matrice à p lignes est la dimension du sous-espace vectoriel 
de K? engendré par les vecteurs-colonne. 


Conséquence : pour calculer le rang d'une matrice, on peut échelonner les 
vecteurs-ligne ou bien échelonner les vecteurs-colonne. 


1.4 Matrices inversibles 


Proposition. Soit À une matrice carrée de taille n. Pour toute matrice carrée C de 
taille n, on a l’équivalence CA = I, > AC = 1,. De plus, s'il existe une telle matrice 
C, elle est unique. 


Démonstration. Supposons que C est une matrice carrée de taille n telle que C'A=1I,.Si X 
est un vecteur-colonne de K” tel que AX=0, alors il vient X=1,X=(CA)X=C(AX)=C0=0. 
L'équation AX = 0 a donc pour seule solution le vecteur nul. D’après le résultat 2 (b) page 114, 


cela veut dire que le rang de À est égal à n. Pour tout vecteur-colonne U € K”, l'équation 
AX =U a donc une unique solution, d’après le résultat 3 (c) page 114. Cette solution vérifie 
X = (CA)X = C(AX) = CU : l'unique solution de l'équation AX = U est le vecteur CU. 
On a donc A(CU) = U, ou encore (AC)U = U, quel que soit le vecteur-colonne U € K”. 
Prenons pour U le i-ème vecteur canonique E;. On sait que le produit (AC')E; est la i-ème 
colonne de AC' (page 133). Puisque (AC)E; = E;, les colonnes de AC sont les E;, donc 
AC = T,. Cela démontre l'implication C'A = 1, — AC = 1,. 

Réciproquement, supposons que C' est une matrice carrée de taille n telle que AC = 1,. En 
intervertissant les rôles de À et C dans le raisonnement précédent, on en déduit C'A = J,. 
Il reste à montrer que si l’on a C'A=AC=I,, alors Cest unique. Supposons que D est une (autre) 
matrice carrée vérifiant DA= AD=I,. Alors il vient D=DI,=D(AC)=(DA)C=1I,C=C.m 
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Définition 

Soit À une matrice carrée de taille n. On dit que À est inversible s’il existe une 
matrice carrée C telle que C'A = I, (ou s’il existe une matrice carrée C' telle que 
AC = I,). La matrice C se note A! et s'appelle l'inverse de À. 


Si AE M, (K) est une matrice inversible, on a donc les égalités AA 1 = A lA=—71,. 
Il s'ensuit que l'inverse de la matrice Al est À : on a (A!) 1 = A. 


Proposition. Soit À une matrice carrée de taille n. 

i) Si la matrice À est inversible, alors pour tout vecteur-colonne U EK”, l'équation AX =U 
a pour unique solution X = A lU. 

ü) La matrice À est inversible si et seulement si rg À = n. 

ï) La matrice À est inversible si et seulement si l'équation AX = 0 a pour seule solution 
le vecteur nul. 


Démonstration. Supposons que À est inversible. Soient X et U des vecteurs-colonne de 
K”.Si AX =U, alors il vient X —1,X = (A !A)X = A-t(AX) = A-1U. Réciproquement, 
si X = ATlU, alors AX = AATU = J,U = U, d'où (i). Il s'ensuit que si À est inversible, 
alors l'équation AX = 0 a pour seule solution X = A7 !0—0. D'après les résultats du chapitre 
précédent, le rang de À est n. 

Supposons réciproquement que rg À — n. Alors pour tout vecteur colonne U € K”, l'équation 
AX =U a une unique solution (résultat 3 (c) page 114). Il y a donc des vecteurs-colonne C; 
tels que AC; = Ei. Soit C'=[C1 C2 --+ Ch] la matrice carrée de colonnes C1,C2,...,Cn. Par 
définition du produit de matrices, les colonnes de AC sont AC, AC2,..., AC, c'est-à-dire 
E:,E2,...,E, : on a donc AC = J, et d’après la proposition précédente, la matrice À est 
inversible, d’inverse C’. Cela montre {ï}. Enfin, on sait que le rang de À est n si et seulement 
si l'équation AX = 0 a pour seule solution X = 0, d’où (iii). ü 


Connaître l'inverse d’une matrice inversible À permet de résoudre tous les systèmes 
linéaires AX = U, quel que soit le vecteur-colonne U. 


Propriétés des matrices inversibles 

Soient À, B,C' des matrices carrées de même taille. 

i Supposons À inversible. Si AB = AC, ou si BA = C'À, alors B = C' : on peut 
simplifier par une matrice inversible. 

ü) Si À et B sont des matrices inversibles, alors la matrice produit AB est inversible 
et (AB) ! = B 141 

ï) Si À est inversible, alors ‘A est inversible et l’on a (A) 1 =t(A-1). 

Démonstration. Supposons À inversible et de taille n. Si AB = AC, alors en multipliant à 

gauche par la matrice A7}, il vient A7!AB= A TAC, c'est-à-dire B=C puisque A7!A=1,. 

Si À et B sont inversibles, alors (B-!A-!)(AB) = B-!(A-l4A)B=B 1I,B=B 1B=1,, 

d’où (ii). On a aussi {(A-!)A (AA 1) =], = 17,, ce qui montre (ii). = 
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En particulier, si une matrice symétrique est inversible, son inverse est symétrique. 


Exemples de matrices inversibles 
ax + py + qz = 0 


a pq 
Pour la matrice A= |0 b r |, l'équation linéaire AX =0 s'écrit by +rz=0. 
00c cz = 0 


Supposons que les coefficients diagonaux à, b,c sont tous différents de 0. La der- 
nière équation donne z — 0; la deuxième s'écrit alors by — 0, donc y = 0 et la 


première s'écrit ax = 0, donc x —0. On en déduit que la matrice À est inversible. 


— Si par exemple b = 0, alors dans la résolution, peut choisir y quelconque : il y a 
donc d’autres solutions que le vecteur nul. Il s'ensuit que la matrice À n’est pas 


inversible. De même, si c — 0 ou si a — 0, la matrice n’est pas inversible. 


Définition 
Une matrice carrée est dite triangulaire (supérieure) si tous les coefficients situés 
strictement en-dessous de la diagonale sont égaux à 0. 


Comme dans l'exemple ci-dessus, on démontre le résultat suivant. 


Proposition. Une matrice carrée triangulaire est inversible si et seulement si ses coeffi- 
cients diagonaux sont tous différents de 0. L'inverse d'une matrice triangulaire supérieure 


(ou inférieure) est triangulaire supérieure (ou inférieure). 


1000 

Exemple. La matrice A — : 4 : : est inversible si et seulement si xy £ 0. 
03by 

D'après la proposition, une matrice diagonale diag(ai,a2,...,a,) est inversible si et 


seulement si les a; sont tous différents de 0; dans ce cas, on a 


[diag(ar, a, … 7. = das (l/ér, 1/06. 1/4,): 


Calcul de l'inverse d'une matrice 

Pour calculer l'inverse d’une matrice inversible À, on résout le système linéaire 
T1 Ui 

A! :|—}]: |, où les coefficients u1,...,u, sont des lettres : puisque la solution 
tn] Lun 

est X — A lU, les coefficients de A! sont ceux qui expriment les x; au moyen de 


U1,..., Un: 
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100 
Exemple. Calculons l'inverse de la matrice A = | 1 1 0 |. On résout le système 
322 
u 
linéaire AX, où U = | v | : 
w 
T=U T=U T=Uu 
T+Y—=U y=—-u+v <— y=-u+U 
3x + 2y + 22 = w 22 = —3u — 2(—u + v) +w 23 = —u — 20 +w 


ü 
v 
vw 


x 1 0 0 
< VU —= 1 1 0 
2 1/2 —1 1/2 
0 
On a donc A7! = | 1 1 
L 


Remarque 

Dans les applications, où les matrices peuvent être de grande taille, on évite en 
général de calculer l'inverse (voir le chapitre 8 pour des méthodes numériques de 
résolution de systèmes). 


1.5 Le groupe affine 


Soit À une matrice carrée de taille n et soit B un vecteur-colonne de R”. La 
transformation de LR” définie par X + AX + B s'appelle une transformation affine. 


Exemple. L'application f : R? — IR? définie par f(x,y) = (x + 2y + 1,3x + 4y +2) 
; À 2 T 1 | [| Ël 
est la transformation affine de R° telle que | Ê al lv +lol: 
Propriétés des transformations affines 
La composée de deux transformations affines de R"' est une transformation affine. 
Si f est la transformation X+- AX+B et si g est la transformation X-CX+D, la com- 
posée go f est définie par (go f)(X)=g(AX+B)=C(AX+B)+D=(CA)X+(CB+D). 
— La transformation affine X - AX + B est bijective si et seulement si la matrice A est 
inversible. Dans ce cas, la transformation réciproque est Y — AlY — AB. 
En effet, pour tout vecteur Y € R”, l'équation AX + B=7Y est équivalente à 
AX =Y — B. Pour que cette équation ait une unique solution quel que soit le vecteur 
Y, il faut et il suffit que la matrice À soit inversible; dans ce cas, la solution est 
X = AY B)— A IV - À LB. 
En choisissant A = J, et B =0, on obtient comme transformation affine l'application 
X + X, c'est-à-dire l'identité de R”. 
Si les transformations affines f et g définies par f(X)= AX +B et gfX)=CX+D 
sont bijectives, la composée go f est bijective et définie par X-(CA)X +(CB+D) : 
la matrice CA, produit de deux matrices inversibles, est inversible. 
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Ces propriétés montrent que les transformations affines bijectives de IR” forment un 
groupe de transformations. Ce groupe s'appelle le groupe affine. 


Transformations linéaires. Considérons seulement les transformations de R" 
de la forme X + AX, où À est une matrice inversible. On dit que ce sont des trans- 
formations linéaires. La composée de deux transformations linéaires de IR" est une 
transformation linéaire et la transformation réciproque de X > AX est Y + A lY. 
Les transformations de la forme X + AX, où À est une matrice inversible, forment 
donc aussi un groupe de transformations de R”. 


1.6 Exemple d'application : un intégrateur numérique 


Le problème. Pour repérer le déplacement d’une pièce en mouvement sur un 
axe, on l’équipe d’un accéléromètre à inertie permettant de mesurer son accélération 
pendant l'intervalle de temps [0,7]. Les mesures ont lieu à intervalles réguliers, 
c'est-à-dire aux instants t = T/n, to = 2T/n, ..., tn 1 = (n—1)T/n, t, =T. Soit y; 
l'accélération mesurée à l'instant t;. 

La position de la pièce sur son axe est déterminée à tout instant { par son abscisse 
x(t). On dispose ainsi des nombres x"”(t;) = +; et l’on cherche l'allure de la fonction 
tt x(t). Il s'agit donc «d'intégrer deux fois» la fonction {+ x”(t) dont on ne 
connaît que les valeurs aux instants t;. 


Approximation de la dérivée seconde. Soit f une fonction deux fois déri- 
vable sur un intervalle. Pour tout t€]a,b|, on a la formule de Taylor-Young (page 301) 


F4 R) — FC = RP + g'(E + oh?) 


où o(h?) désigne une quantité négligeable devant h? quand h tend vers 0. En 
remplaçant h par —h, il vient 


FE h) — (6) = h F0 + LE" + of) 
et en ajoutant ces deux égalités, on obtient 
FER) — 2f(0) + FC R) = REP + of). 
fG—h)—2f() + f(t+h) 


h°? 
Pour h assez petit, le nombre = [f(—R) — 2f(t) + f(t+h)] est donc une bonne 


2 


Ainsi le rapport tend vers f”(t) quand h tend vers 0. 


approximation de f”(t). 


Un procédé d'intégration numérique. Utilisons cette approximation pour éva- 
luer les x(t;). Prenons h = T/n. Si n est assez grand, alors pour i—=1,2,...,n—1, 
le nombre 


CHAPITRE 5 - MATRICES ET DÉTERMINANTS - 141 


est très proche de h?x"”(t;) = h?y;. On aura donc une bonne approximation des 
di = x(t;) en résolvant les égalités 

To — 221 + Lo — h?y 

æ1 — 222 + 8 = hp 
(S) m2 — 273 + aa = h3 


2 
Ln-2 — 2Xn-1 + Tn = h Yn-1 


Détermination des solutions. Une fonction f n’est pas déterminée par sa déri- 
vée seconde : en effet, si a et b sont des nombres quelconques, la fonction £+ g(t) = 
f(t)+at+b a pour dérivée seconde g”= f”. Pour déterminer g, on peut fixer sa valeur 
en deux points : si l’on connaît g(u) et g(v), où uv, les égalités au+b=g{u) — f(u) 
et au + b = g(v) — f(v) permettent en effet de calculer les nombres a et b. 
Dans notre cas, donnons-nous les valeurs x9 = æ(0) et x, — x(T) aux bords de 
l'intervalle [0,7]. Pour n = 6, le système d'équations s'écrit 
— 2% + To = R?1 — X0 
mi — 222 +23 = hr 
(S) La — 23 + Ta = h?3 
ts — 2ra +25 = h?y4 
da — 225 = hy5 — %6 


—2 1 0 0 0 

. 1-2 1 0 0 
Résolution. La matrice du système est À — 0 1-2 1 O!|.Ses coefficients 

0 0 1-2 1 


0 0 0 1 —2 
non nuls sont concentrés sur la diagonale et de part et d'autre de celle-ci; de plus, 


parallèlement à la diagonale, les coefficients sont égaux. Une telle matrice est dite 
tridiagonale. Calculons l'inverse de À en résolvant le système 


— 2%, + = U] 
Ti —2%X9 + T3 = U9 

FD] _ 22%3 + T4 = U3 

T3 —2T4 +Xs = Ua 

Ta  —2%5 = U5 


En multipliant par 5 la première équation, par 4 la deuxième, etc, et en ajoutant 
toutes les équations, les inconnues %2,%3,%4,%5 s’éliminent et l’on obtient simplement 


—6%: — DU] + Auo + 3U3 + 2u4 + U5. 


De même, en multipliant la dernière équation par 5, l’avant-dernière par 4, etc, et 
en ajoutant, il vient 
—6t5 = U1 + 2u2 + Bus + Aus + us. 


142 - MATRICES 


© Dunod -— La photocopie non autorisée est un délit. 


En reportant dans la première et dans la dernière équation, on en tire x2 et %4 : 
—3xo = —3u1 — 6x1 = 2u1 + duo + 3u3 + Qus + Us 
—3t4 = —3u5 — 6% = 1 + 2u2 + 3us + Aua + 2us 
—623 = Suz — 322 — 3x4 = Su + Gu2 + Ju + Gus + Bus. 


54321 

48642 

L'inverse de la matrice À est donc At=et 36963 
6124684 

12345 


Un exemple numérique. On fait cinq mesures d'accélération, une toute les vingt 
secondes : ces mesures sont donc effectuées aux instants t; = 20i, où i=1,...,5. On 
a h=—20, n—6 et T = nh — 120. Voici les valeurs mesurées (; est en ms ?) : 


t 20 40 60 80 100 
 X 10° | 2,44 | 1,20 | —0,03 | —1,27 | —2,51 


Si les positions initiales et finales (exprimées en mètre) sont x(0) = x0 = 0 et 


a(T) = x6 = 1, alors les valeurs approchées %1,2%2,...,15 sont données par 
ai hi —0 —0,63 
T2 R° —0,27 
23 | = AT | h = | 0,56 
TA h2 1,38 
T5 2 1,69 
h 15. 1 
La figure 1 ci-dessous montre la ligne polygonale des points (;,x;) pour i=0,2,...,6. 


Sur la figure 2, on propose une courbe t-x(t) deux fois dérivable ayant la même allure. 


r 7 > r r > 
0.6 08 1 0.6 08 1 


figure 1 figure 2 


Cas général. Pour n quelconque, la matrice du système (S) est 


—2 1 0 0... 0 
1-2 1 0:.. 0 
0 1-2 1:.. 0 
A= : . 1 
0 1—2 ! 
0 0 1 —2 
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Cette matrice est symétrique et tridiagonale. On vérifie facilement que l'inverse de A 
est la matrice symétrique dont le coefficient en position i-ème ligne, j-ème colonne 


i(n +1 3) Si7< 7 et = ri +1 i) Si? > 7 


1 
est — 
n +1 


2. Déterminants 


Nous allons présenter la notion de déterminant d’une matrice carrée : c’est un outil 
théorique puissant, notamment pour caractériser les matrices inversibles. 


2.1 Déterminant d'une matrice carrée de taille 1, 2 ou 3 


Définitions 
Le déterminant d’une matrice [a] de taille 1 est le scalaire a. 
Le déterminant de la matrice À — Ê | est le nombre ad — bc. On le note 
a b 
det À ou | 
c d 


On a l'égalité ke 4 L£ n = Le 2 al = (ad — bc)12 = (det A2. Il 


s'ensuit que si det À n’est pas nul, alors la matrice À est inversible et 


Le = _ IE s 


On a det 1 — 1 et les propriétés immédiates suivantes. 


i) Si les colonnes de la matrice À sont égales, alors le déterminant est nul. 


ü) Le déterminant est additif par rapport à chaque vecteur-colonne : 


à 4 # V4 
b a b b b+b a b b 
an — re pere le He SL 
c+c d c d c d c d+d c d c d 
ïüi) Si l’on multiplie une colonne par un scalaire À, alors le déterminant est multiplié 
a b a b a Àb 
ar À : en effet, on a = — | 
P Xc d cdl—|e M 
Définition à di 
Le déterminant de la matrice À — | ax @22 &3 | est le nombre 
31 32 33 
@11 @12 13 
détA= la où al =; Q22 93 | . Q21 493 , Q21 G22 
a32 33 a31 433 a31 @32 
a31 432 433 


Dans cette expression, les coefficients de À en facteur des déterminants sont ceux de 
la première ligne : on dit qu’on a développé le déterminant selon la première ligne. 
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Pour avoir le déterminant de taille 2 associé dans la formule à un coefficient c de 
la première ligne, 
on supprime dans À la première ligne et la colonne de c 


- et l’on prend le déterminant formé des quatre coefficients restants. 


Noter l'alternance des signes. 


Exemples 
On a 
1 2 —1 
ali) 0e) he 
æ Î =; 1 —1 x 
L æ 
=(-1-2)-2x(2+xr)-(2r-1) 
1-2 4-97 — 2x +1— (x + 4x +4) = (x +2). 
a O 0 bo 
Pour une matrice triangulaire inférieure, il vient | x b 0|—a . À — abc, produit 
Y zC 


des coefficients diagonaux. En particulier, det 13 — 1. 


Les déterminants de taille 3 possèdent encore les propriétés mises en évidence 
dans le cas de la taille 2. Notons A:, 42, A3 les vecteurs-colonne de la matrice et 
det(A:, 42, A3) le déterminant. 

Si deux colonnes sont égales, alors le déterminant est nul : par exemple, si 
G22 Q23 
Q32 33 


Q21 Q23 
a31 433 


Q21 @22 
Q31 432 
comme &11 = @, il vient det À = 0. 


A1 = À), alors le déterminant est nul, on a = 


ü Le déterminant est additif par rapport à chaque vecteur-colonne : cela veut dire 
que l’on a det(A; + 4°, A2, 43) = det(A1, A2, A3) + det(A', A2, A3) et de même 
pour det(A1, 4 + 4', A3) et det(A:, A2, A3 + À). 

ïüi) Si l’on multiplie une colonne par un scalaire À, alors le déterminant est multiplié 
par À : det(ÀA1, A), À3) — det(A:, X4b, A3) —= det(A1, 4, A3) — ÀAdet(A1, 4, A3). 


2.2 Déterminant d'une matrice carrée de taille n 


On définit le déterminant d’une matrice carrée de taille n au moyen du déterminant 
des matrices de taille n—1, comme on l’a fait dans le cas n — 3. 


Définition 

Soit À une matrice carrée de taille n. Pour tous indices à et j, le cofacteur A;; 
est le déterminant de taille n—1 obtenu en supprimant la 5-ème ligne et la j-ème 
colonne de À. 
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- Pour la matrice À — Ë 2E on a An =d, A =c, An = bet A» = a. 
- Pour une matrice À = [A;;] de taille 3, on a Ari =  i. , = | 
2 a32 Q33 a31 433 
NE ps a . Par définition du déterminant de À, il vient donc 
31 432 
det À = aAy — a2À 5 + a3A 13. 
Définition 


Le déterminant d’une matrice carrée À = [a;;] de taille n est le nombre 
det À = an An — A9 ++ (—1) M aAiÿ + + (1) 'ainAin 


Cette expression s'appelle le développement du déterminant selon la première ligne. 


Propriétés relatives aux colonnes 


En raisonnant par récurrence sur la taille du déterminant, on démontre en utilisant 
la définition que det 7, — 1 et qu’un déterminant de taille n possède encore les trois 
propriétés précédentes. Formulons ces propriétés dans ce cadre général, en notant 
A1, 4,...,A, les colonnes de la matrice. 


Propriété 1. Si deux colonnes de la matrice sont égales, alors le déterminant est nul. 

Propriété 2. Le déterminant est additif par rapport à chaque vecteur-colonne : 
det(Aisese As À) = det(disss A8 A) det(Aisss dus, A). 

Propriété 3. Si l’on multiplie une colonne par À, le déterminant est multiplié par À : 


det(A:1,...,ÀA;,...,A:) = Àdet(41,...,4;,...,4,). 


Voici une conséquence de la propriété 3 : 
Propriété 3*. Si une colonne est nulle, le déterminant est nul. 
En effet, si l’on multiplie une colonne nulle par 0, elle ne change pas, mais le 
déterminant est multiplié par 0. 
On en déduit aussi les propriétés suivantes. 
Propriété 4. Si l’on permute deux colonnes de la matrice, le déterminant est changé 
de signe. 


Considérons le déterminant d=det(A1+A2,A1+42,43,...,4,). Puisque les deux pre- 
mières colonnes sont égales, on a d=0 (propriété 1). En utilisant la propriété 2, il vient 


d = det(A1, A+ A9, A3, , An) + det(As, A+ A9, A3,.…, An) 
= det(A1, A1, 43, , An) + det(Ar, A, A3, , An) 
+ det(A, A1, As, .…, An) + det(A2, A, As, .…., An) 
= 0 + det(A:, 42, 43,..., A4») + det(Ao, A1, 43,..., An) +0 d'après 1, 
d'où 0 = det(A:, 42,...,A,) + det(Ao, A1,..., An). 
Propriété 5. 
Si une colonne est combinaison linéaire des autres, le déterminant est nul. 
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- Si l’on ajoute à une colonne une combinaison linéaire des autres, le déterminant 
garde la même valeur. 


En effet, si U — À249 +:::+X, À, est une combinaison linéaire de A4:,...,4,,ona 
det{U, Ab, .. , An) —. À det(A2, A, .. , An) He. + À det(A,,, A, .. > An—1: An) = 0 
car au second membre, chaque déterminant a deux colonnes égales. On en déduit 


det(A1 +U, A,. . ., An)=det(A1,49.. . ., An)+det(U, A2.. . ., An)=det(A:,42.. . A): 


Propriétés relatives aux lignes 

Nous allons montrer que le déterminant possède, par rapport aux lignes, les mêmes 
propriétés que ci-dessus. 

Propriété 1'. Si deux lignes de la matrice sont égales, alors le déterminant est nul. 
Propriété 2'. Le déterminant est additif par rapport à chaque vecteur-ligne. 
Propriété 3'. Si l’on multiplie une ligne par À, le déterminant est multiplié par À. 
Démonstration. On vérifie immédiatement que ces propriétés sont vraies pour un déter- 


minant de taille 2. Raisonnons par récurrence sur la taille du déterminant. Supposons que 
les propriétés 1', 2' et 3' sont vraies pour les déterminants de taille n—1 et considérons une 


matrice À de taille n, de vecteurs-lignes L:,Lo2,...,L,. 
11 @12 ‘din 
Lo 
À = 
Ly 


Si l’on multiplie la première ligne par À, alors dans le développement selon la première ligne 
det À = a11A11 — an2A12 +++ (—1) A; +...+(—1) Au, 
les A:; sont inchangés, donc le déterminant est multiplié par À. Si l’on multiplie une autre 
ligne par À, alors dans chaque A;; une ligne est multiplié par À, donc A;; est multiplié par À 
par hypothèse de récurrence : le déterminant de À est donc aussi multiplié par À. En raisonnant 
comme pour les colonnes, il s'ensuit que si une ligne est nulle, alors le déterminant est nul. 
De même, il est clair que le déterminant est additif par rapport à la première ligne ; par hypothèse 
de récurrence, les A;; sont additifs par rapport aux lignes, donc aussi le déterminant de A. 
Si deux lignes sont égales parmi les lignes numéro 2,3,...,n, alors chaque A:; possède deux 
lignes égales, donc est nul : il s'ensuit que le déterminant de À est nul. Supposons maintenant 
que la ligne L: est égale à la ligne L}, où k 2 2. Si cette ligne est nulle, le déterminant est 
nul d’après le développement selon la première ligne. Supposons que dans la ligne L; = Lz, 
le premier coefficient non nul est a, donc 
Li =[0 0 aim ++ ain] = Lx. 
Pour tout j > m +1, remplaçons la colonne À; par la combinaison 4° = A; — (a&15/@im)Amr 
ce qui ne change pas le déterminant d’après la propriété 5. Sur les lignes 1 et k, le coefficient 
de 4° est &; — (&15/@1m)aim = 0, donc 
0 +: O aim 0 ++ 0 
*k 


0 +. O &im 0 0 
* 


det À = det(A1,..., Am, 4,31,..., 4%) = 
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Développons par rapport à la première ligne : il vient det A = (—-1)! "a, A1, et dans le 
déterminant A:,,, la ligne numéro k—1 est nulle (elle est en position k dans À). Nous avons 
remarqué ci-dessus que cela implique A:,, = 0, donc det À — 0. = 


Comme pour les colonnes, on en déduit les propriétés suivantes. 

Propriété 3'*. Si une ligne est nulle, le déterminant est nul. 

Propriété 4". Si l’on permute deux lignes de la matrice, le déterminant est changé 
de signe. 

Propriété 5'. Si l’on ajoute à une ligne une combinaison linéaire des autres, le 
déterminant garde la même valeur. 


2.3 Les théorèmes fondamentaux 


Proposition. Si f est une fonction de AM, (K) dans K possédant les propriétés 1, 2 et 
3, alors pour toute matrice M € AM, (K), on a f(M) = f(1:) det(fM). 

Justification. Expliquons cela pour n = 3. Supposons que f :.43(K) — K est une fonction 
possédant les propriétés 1, 2 et 3, donc aussi la propriété 4. Pour j=1,2,3, notons (a1,.a2;,@3;) 
les coordonnées du vecteur-colonne À; de la matrice À. On à À; = a1,E1 + a2;E2 + a3,E3, 
où les E; sont les vecteurs canoniques de K*. D’après la propriété 2, il vient 


Î(E1, 42, A3) = f(Eu, A2, @13E1) + f(E1, A2,423E2) + f(E1, A2,a33E3) 
= @13/(E1, A2, E1) + a23f(E1, A2, E2) + a33f(E1, A2, Es), grâce à 3, 
— @23.f(E1, A2, E2) + a33f(E1, A2, Es), car f(E1, A2, Es) = 0. 
Î(E1, A2, E2) = a12f(E1, E1, E2) + a22f(E1, E2, E2) + a32f(E1, Es, E2) 
= a32f(E1,E3,E2) = —-a32f(E1,E2,E3), d'après 1 et 4. 
De même, on a f(E1,/A2,E3) = @22f(E1,E2,E3) d'où 
Î(E1, A2, 43) = (—a23a32 + a33022) f(E1, E2, Es). 
On obtient de la même manière 
Î(E2, A2, 43) = (—@i2a33 + a13a32)f(E1, E2, Es) 
Î(Es, A2, 43) = (a12a23 — a13022) f(E1, E2, Es) 


et il vient 
JA, 42, A3) = f(ar1E1 + a E2 + a31E3, A2, A3) 
= a11f(E1, 42, 43) + 21 f(E2, A2, A3) + a31f (Es, A2, A3) , d'où 
f(A1.42,43)= [a11(assa22—a23a32)—an1(a12a33—a13032)+a31 (a12023— 413022) | Î(E1,E2.,E3). 
Le crochet est égal à 


Gi1 21 @31 
@12 @22 32 
d13 G23 33 


&22 à &12 à &12 à ; 
22 #|-a Les … ” Les = = det(tM) 


&@11 | 
ü23 33 @13 33 d13 23 


par définition du développement de *M selon sa première ligne. 

La fonction f est donc parfaitement déterminée par le nombre f(E1,E2,E3)= f(13).Silona 
f(3) = 1, alors f(M) = det(tM) quelle que soit M. Dans le cas général, posons a = f(13). Si 
a70, alors la fonction g:M+-(1/a)f(M) possède les propriétés 1, 2 et 3 et g(13)=(1/a)f(13)=1, 
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donc g(M) = det(*M) et dans ce cas, on a bien (M) = ag(M) = adet(M). Si a = 0, alors 
la fonction f est nulle et l’on a encore f(M) = adet(*M) pour tout M. = 


On en déduit de nouvelles et importantes propriétés du déterminant. 


Proposition. Pour toutes matrices carrées de taille n, on a det(*A) = det À et 
det(AB) = (det A)(det B). 


Démonstration. Pour toute matrice ME, (K), posons f(M)=det(AM). Par définition du 
produit de matrices, on a f(WM)=det(AM;,..., AM, ), où M,...,M, sont les vecteurs-colonne 
de M et cela montre que f possède les propriétés 1, 2 et 3. Puisque f(7,)=det(AJ,)=detA, on 
déduit de la précédente proposition que l’on a det(AM)= f(M)=(detA)(det'M) pour tout M. 
En particulier, pour A=1I,, il vient det M—(det1,)(det'M)=dettM, ce qui est la première pro- 
priété. On en déduit alors l'égalité det(AM)=(det A)(dettM)=(det A)(det M), pour tout M. 8 


Montrons que le déterminant permet de caractériser les matrices inversibles. 


Proposition. Une matrice carrée est inversible si et seulement si son déterminant est 


non nul. Si À est une matrice inversible, alors det(A71) — = 
€ 


Démonstration. Soit A€.4,(K). Si À est inversible, alors (det A)(det A1) = det(AA-1) — 
det 1, = 1, donc le nombre det À n’est pas nul et det(A7!) est l'inverse de det A. Suppo- 
sons que la matrice À n’est pas inversible. Alors rg À est strictement inférieur à n, donc les 
vecteurs-colonne de À ne sont pas indépendants (proposition page 138 et théorème page 137). 
Il s'ensuit qu’au moins l’un des vecteurs-colonne est combinaison linéaire des autres, donc le 


déterminant de A est nul, d’après la propriété 5. = 
1 2-1 

Exemple. La matrice 2—1 x| de l'exemple page 145 est inversible si et 

seulement si x 7 —2. —l & 1 


Développement selon une ligne ou une colonne 


Le déterminant a été défini par son développement selon la première ligne. Mais échan- 
Qi @12 @3 
G21 G92 Q3 |. 
a31 432 433 
et en développant le déterminant de 4’ selon la pre- 


geons par exemple la première et la deuxième ligne dans la matrice A= 
a21 G22 | 


On obtient 4’ = | ax ar &13 
@31 432 33 


mière ligne, il vient det 4’ = a21A 21 — a22A» + a23A»3, où les AÀ;; sont les cofacteurs 


pour la matrice À. Puisque det À = — det 4’, on a le développement 
det À = —-an An + a A» — a3A»%. 


Plus généralement, on peut développer un déterminant selon une ligne à quelconque, 
par la formule 


detfa;;] = (—-1) au + (—1) aioA 2 + +22 + (1) ain Ain : 
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Puisque transposer la matrice ne change pas le déterminant, on peut aussi développer 


selon une colonne j, avec la formule 


det[a;;] = (—1) a; Ai + (—-1) a9 A9; + 22 + (1) an; An; - 


Les signes qu'il faut affecter aux coefficients le long de la ligne ou de la colonne 


choisie pour développer sont donnés par le tableau : 


Le premier signe en haut à gauche est + et l’on garnit le tableau en changeant de 


signe chaque fois qu’on passe à la colonne ou à la ligne suivante. 


2.4 Calcul d'un déterminant 


Le déterminant garde la même valeur si l’on ajoute à un vecteur-colonne, ou à un 


vecteur-ligne, une combinaison linéaire des autres. Par cette opération, on peut faire 


apparaître des zéros sur une même ligne ou sur une même colonne, comme lorsqu'on 


échelonne des vecteurs. Quand on a obtenu une ligne ou une colonne contenant peu 


de coefficients non nuls, on peut raisonnablement développer le déterminant selon 


cette ligne ou cette colonne. 


Exemple. Calculons le déterminant d — 


1 2 
il 


1 


1 2—x 
1 
2 


2 


Soustrayons la troisième colonne à la première, puis ajoutons la quatrième à la seconde : 


Ajoutons la première ligne à la troisième : 


—x 0 2 
O0 —x 1 
| à pds 
O0 —x —1 
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a L 

2 

—2 
= —T 
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1 
x 1 À 
2 
En développant selon la première colonne, il vient d= —-x| 0 4—-x —2 |. Dans le 
pe il eo 
déterminant de taille 3, soustrayons la première ligne de la troisième : 
—x 1 = 
d=-1| 04-x —2 
0 —2 1-x 
Développons selon la première colonne : 
d=(-2)(-2) ET 2 2 22f(4 7) 2)(—2)] = 2°/(2? x) =2(x—1 
= (o)(-0) TS 2 = 2 [4 2) — 2) — (-2)(-2)] = 2/2 — à) = a (a 1). 
Proposition 


i) Le déterminant d'une matrice triangulaire est le produit des coefficients diagonaux. 
ü) Si À et B sont des matrices carrées de taille n et p, une matrice carrée de taille n +p 


AC 
de la forme o [8 a pour déterminant (det A)(det B). 


Démonstration. Si A = {a;;] est une matrice triangulaire inférieure, le développement selon 
la première ligne est det M = a11 A1, et A1 est un déterminant triangulaire inférieur ayant 


pour coefficients diagonaux @22,...,@nn. On en déduit (i) en raisonnant par récurrence. 
M]|[ C 
Soit Bel, (K) et CEA, »(K). Pour toute matrice ME.M,(K), posons f(M)= o = 
La fonction f possède les propriétés 1, 2 et 3 (par rapport aux colonnes de M). De plus, en 
I |LC 
développant le déterminant û selon la première colonne, il vient f(1,) = det B. 
B 
D'après la proposition page 148, on en déduit f(M) = f(1,) det M = (det B)(det M) pour 
tout M. D'où le résultat en choisissant M = À. = 


2.5 Polynôme caractéristique d'une matrice carrée 


Définition 

Soit À une matrice carrée de taille n. Pour tout nombre z € K, on pose C'A(z) = 
det(A—21,). La fonction z2+ CA(z) est un polynôme de degré n, appelé polynôme 
caractéristique de A. 


Exemple. Si 4 — [a e alors det(A — 21) — 


et il vient Ca(z) = 2? — (a + d)z + (ad — bc). 


Le polynôme caractéristique est de degré n et son terme constant est C'4(0) —det À. 
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On a Ca =(-1)"29 + (1) (tr A)2- 1 +... + det À, où tr À est la somme des 
coefficients diagonaux de À. Le nombre tr À s'appelle la trace de A. 

- Les matrices À et A ont même polynôme caractéristique : en effet, ‘A — zI, — 
(A — z1,) et deux matrices transposées ont même déterminant. 

Voici une propriété importante du polynôme caractéristique. Rappelons que si 

P = ag +... + a12 + à est un polynôme, on a défini (page 134) la matrice P(A) 

en posant P(A) = Ass dl. 


Théorème de Cayley-Hamilton. Pour toute matrice carrée A, la matrice C'A(A) 


est nulle. 
@i1 —Z  Gi2 ee din 
: ñ @21 22 2:  U2n 
Démonstration. Posons À = fa;;], donc À — 21, = 4 ; . Posons 
An1 An2 °°° Ann — 2 


D;(2)=(-1) "3% A;;, où les A;; sont les cofacteurs de A— z1,. Alors D;(:) est un polynôme 
et par définition du polynôme caractéristique de À, on a 

(1) CA(z) = (ai — 3) D1(2) + a12D2(2) +++ + air Dr(2) ++: + ain Dn(2) 
Remplaçons la première ligne par la k-ème, où k > 2 : les cofacteurs A; sont inchangés, 
mais le déterminant obtenu est nul, car il a deux lignes égales : 

(2) 0 = ax1Di1(z) + ax2Doa(z) ++: + (axx — 2)Di(z) + +: + axn Da(z) 

En notant À; la j-ème colonne de A,ona AEj=A;=a;E1+a2;E2+...+a;;E;+...+a,;En 
ou encore 


(3) O=a1;E1 + a2;E2 +: t (ajjln A)E; 4 + + Anj En 

Écrivons ces égalités pour j = 1,2,...,n puis multiplions la première par la matrice D:(A), 

la deuxième par D2(A), la j-ème par D;(A) et la n-ième par D, (À) : 
D;(A)x 0 — (ai11n A)E: } @91 E2 SF: SET An1 En 
D:(4)*x 0 — G12E1 + (a22ln — A)E2 +: + An2En 
D,(A)x 0 — Gin E1 + Gon E2 TH Heu (CES — A)En 

En ajoutant ces égalités en colonne, on obtient l'égalité matricielle 

(4) 0 = ME: + M E2 +... +M,Eh 


où My — D;i(A)ay + Da(A)ax2 ++ Dz(A)(agrln Eu A) see D,(A)arn: 
Posons P;(2) = agi D1(z) + ax2Do(z) +++ + (agx — 2)Dy(2) ++: + agn Dn(2). 
Le polynôme P,4 vérifie P,(A) = M4, car À et Dy(A) commutent. D'après (1), on a Ps = CA 
et d’après (2), il vient P; = 0 pour tout k = 2,...,n. L'égalité (4) s'écrit donc 
0 = Pi(A)E1 + Po(A)E2 +: + P,(A)En = CA(A)E1. 
Cela veut dire que la première colonne de la matrice C'A(A) est nulle. Pour montrer que la 
i-ième colonne de C'A(A) est nulle, on remplace, dans la matrice À — z1,, la i-ème ligne par 
la k-ième, où k Zi, et l’on suit le même raisonnement. = 


Exemple. Pour une matrice de taille 2, le théorème de Cayley-Hamilton affirme 
que l’on a 4? — (tr A)A + (det A)l» = 0. Cette identité se vérifie directement. 
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2.6 Applications des déterminants 


Caractérisation des bases de K? 

Des vecteurs u1,u2,...,u, de K? forment une base de K? si et seulement s'ils sont 
indépendants (propriété 2, page 120), c’est-à-dire si et seulement si la matrice de 
colonnes u1,...,u, est inversible. On a donc l’équivalence suivante. 


Des vecteurs u1,u2....,u, forment est une base de K? si et seulement si det(ui ,u2,.. .,up)70. 


Equation d'un hyperplan 

Soit À l'hyperplan de K? engendré par les p—1 vecteurs indépendants u1,u9,...,up-_1. 
Cela veut dire qu'un vecteur X appartient à H si et seulement s’il est combinaison 
linéaire des u;. D’après le théorème page 105, cette condition signifie que les vecteurs 
U1, U2,..., Up1, À ne sont pas indépendants. On a donc l’équivalence : 


XeH< det(u,u,...,up_1, X) = 0 


Il suffit de poser X = (x1,...,%,) et de développer le déterminant pour avoir 
l'équation de Æ sous la forme aix +: + aptp = 0. 


Équation d'un plan affine de R°. Soient A, B,C' trois points de R° non ali- 
gnés et soit P le plan affine passant par À, B et C. Un point M appartient à P si 
et seulement si le vecteur CM est combinaison linéaire des vecteurs indépendants 
AB et BC. En notant (&, a, a3) les coordonnées de À et (b1,b:,b3) celles de B, 
une équation de P est donc 

bi—ai C—-b1 —-c 


bo—a2 C2—ba UC | = 0 
b3—a3 C3—03 2—C3 


Estimation du rang d'une matrice 


Soit À une matrice à p lignes et n colonnes. Supposons que r est un entier infé- 
rieur ou égal à p et n et que la matrice U formée des r premières lignes et des r 
premières colonnes de À a son déterminant non nul : 


* 


a-|[E :| et detU Z 0. 


Par hypothèse, il n’y a aucune relation linéaire entre les colonnes de U, donc 4 fortiori 
il n’y en a aucune entre les r premières colonnes de À. Les r premières colonnes 
de À sont donc indépendantes et par suite, on a rgA2>r. 

Plus généralement, si en sélectionnant r lignes et r colonnes de À, on peut former 
une matrice de déterminant non nul, alors le rang de A est supérieur ou égal à r. 
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Élimination polynomiale 

On a parfois besoin de savoir si deux polynômes ont une racine complexe commune. 
Nous allons voir que les déterminants permettent d'exprimer cette propriété par une 
relation entre les coefficients des polynômes : cela est utile, car on ne sait pas, en 


général, calculer les racines des polynômes. 
Soient À et B des polynômes non constants à coefficients réels ou complexes. 
Supposons que À et B ont une racine commune a € C. On a donc A=(z-—a)P et 


B=(2-a)Q, où P et Q sont des polynômes. Il vient QA—PB=Q(z-a)P-P(z-a)Q=0, 
donc QA = PB, avec deg P = (deg À) — 1 et deg Q = (deg B) — 1. 


Supposons que À et B n'ont pas de racine commune, c’est-à-dire sont étrangers. 
D’après la proposition page 50, il existe des polynômes U et V tels que AU + BV = 1. 
Supposons que P et Q sont des polynômes non nuls tels que QA = PB. On a 
P = P(AU + BV) = PAU + PBV = PAU +QAV = A(PU +QV), donc deg P > deg A. 
Puisque deg À + deg Q = deg B + deg P, il s'ensuit deg Q > deg B. 


Ce raisonnement montre que les polynômes À et B ont une racine commune dans 
C si et seulement s’il existe des polynômes non nuls P et Q tels que QA = PB, 
deg P < deg À et deg Q < deg B. 

Posons À = a,2P + PET ++ az+ao et B=0b,21+ bg-127" | + eee + biz + bo, 
où les coefficients a, et b, sont différents de 0. 

Un polynôme Q de degré strictement inférieur à q est une somme de monômes /3,2! 
où 0<i<q—1, donc GA. 27 A. De même, si deg P<p, alors PET yat. 
Les polynômes QA et PB sont de degré inférieur ou égal à p+q—1. 

À tout polynôme T'=to+tiz+:: +ép+g 1277971, associons le vecteur des coefficients 


UT) = (os t1,+.. ,D4g-1). On a donc v(T) € CPI, 


Écrivons en ligne les vecteurs associés aux polynômes A,24,...,21 A: 
v(A) : ao &i a: ap 0 0 :.. 0 
v(2zA) : O0 ao @1 -:- ap-1 4p 0 + 0 
v(27 14) : 0 +: 0 ao à@1 @2 -** @p-1 Gp 


Dans cette disposition, les coefficients de À sont décalés d’un rang à chaque ligne; 


il y a q lignes et p + q colonnes. 
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En faisant de même avec les p polynômes B,2B,...,2?-1B et en superposant les 
deux tableaux, on obtient la matrice carrée de taille p + q 


Go @ Go ap 0 0 
0 do & '" ap_1 A 0 (0 
0 O0 à a ::: a,-1 a 0 0 
0 0 a) &1 Ap-1 Ap 
bo b1 bo by 0 

0 bo à - bi à 0 0 
0 _—. O bp by --.-.. bi by 


Le déterminant R(A,B) de cette matrice s'appelle le résultant des polynômes À et B. 


S'il existe des polynômes non nuls P et Q tels que QA = PB, deg P < deg À et 
deg Q < deg B, alors avec les notations précédentes, on obtient 


_T grut (2 A) = v(PB) En (zŸB) 

i=0 
L'égalité v(QA) — v(PB) = 0 est une relation linéaire entre les vecteurs-lignes de la 
matrice, donc le ue est nul. Réciproquement, s’il existe une combinaison linéaire 
+ Bav(z* À) — Sa Lo 7;0(27B) = 0 à coefficients non tous nuls, alors les polynômes 
D=rt ee P— n 727 sont non nuls et vérifient v(QA) = v(PB), donc 
QA = PB. On a ainsi la proposition suivante. 


Proposition. Des polynômes non constants À et B ont une racine complexe commune 
si et seulement si leur résultant R(A, B) est nul. 


Si l’on peut éliminer la variable z entre les deux équations A(z) = 0 et B(z) = 0, 
on obtient une condition équivalente à R(A, B) = 0. 


Exemple. Considérons un circuit électrique composé d’une résistance p, d’une in- 
ductance L et d'une capacité C montées en série. L’intensité en régime libre est 


: d : 1e ; 
une fonction & — _ du temps, où la charge q(t) de la capacité satisfait l'équation 


q 
C 
Si les racines du polynôme A= Lz?+p2+1/C' sont les nombres complexes r+wi, où 


w £ 0, les solutions sont q(t) = ae"! cos(wt + 6) et l’intensité présente des oscillations 
amorties (car r = —p/2L est négatif). Si le polynôme A possède deux racines réelles 
X et y, les solutions sont q(t) = aet + bel! : le régime est apériodique et l'intensité 
tend encore vers 0 quand t tend vers l'infini, car À et y; sont négatifs (page 52). 

La condition pour que deux circuits oscillants aient un régime commun est R(A,B)=0, 
où À et B sont les polynômes associés aux équations différentielles. En posant 


dq . dq 
différentielle Z Je — pr + = =0 (voir au chapitre 15). 
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B=L'2+9p2+1/C", il vient 


LE pp LÉ 
_| 0 1/C p L 
RÉSE= io À 0 
0 1/C' p L' 
. 1 l'\8, 1.2. p\ye. 
et la condition est Le re) + PA ve ra Le 7) = 0. 


a Exercices emammmmmnx 


1 r r? r, 
1. Montrer que si r +1, l'inverse de la matrice À = | ?, : T° | est la matrice A7 
1 7 0 0 25 1 1-2 0 0 
D Ur Ti ve 0 | mi géuediveedee= 1-2 5-2 0 
2710 : _r2_1 # | En déduire l'inverse de B — 0-2 5-9 
0 0 r —1 0 0-2 1 
bla 
@ 2. a) Calculer le déterminant de la matrice À = | 1 à 1 |. Montrer que si a = b, ce 
a 1 b 


déterminant est nul. Mettre en facteur a — b dans l'expression de det À. 


b) Calculer le rang de la matrice À en fonction des valeurs de a et de b. 


3. Soit L une matrice-ligne à n colonnes et C' une matrice-colonne à n lignes. Montrer 
que si L ou C n’est pas nulle, la matrice produit C'L (qui est carrée de taille n) 
est de rang 1. 


4. On considère un système linéaire AX = K, où À est une matrice et X une matrice- 
colonne non nulle. Supposons que X1 et X2 sont des solutions. Comment faut-il 
choisir les nombres a; et a> pour que a X1 + aX2 soit solution ? 


5. Matrices de Pauli. En Mécanique quantique, on utilise les matrices de Pauli. Ce sont 
les matrices à coefficients complexes définies par 


= JO: __ FO —3 __ [1 O0 
Ge = [T 0! ou = | 6 0e = [5 1] 


a) Montrer que ces matrices ont pour déterminant —1 et pour trace 0. 


eg 0 =]; Cry = —OyOx = 10; et OxOy — OyOx = 280. 


b} Montrer que l’on a 0, =, 


c) Démontrer l'égalité o:0,0, = 1 D. 


d) Soit M— È : . Trouver des nombres p,qx,4y,q- tels que M=pli+q20%+Qy0y+4202. 


Vérifier que l’on a p = (1/2)tr(M}), qz = (1/2)tr(Moz), qy = (1/2)tr(Mo,) et 
q: = (1/2) (Mo). 


e) Les matrices de Pauli ont toutes le même polynôme caractéristique : calculer ce 
polynôme. 
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@ 6. 


@ 7. 


Tableaux d'achats-ventes. On considère une économie en système fermé, formée de n 
secteurs d'activité 51,...,S,. Notons x; le volume des ventes du secteur S; et x; ; 
la part de ces ventes utilisée en achat par le secteur S;, où j Æi. L'équilibre du 
secteur 51 s'écrit donc æ1,9 +213 +: + Tin = T1. 


a) Faisons l'hypothèse (raisonnable) que le montant des biens fournis par le secteur 
S; au secteur $; est proportionnel à la production-vente de S; : cela se traduit 
par l'existence d’un coefficient constant a; ; tel que x;; — a; ;jx;. Posons pour 
simplifier a;,; = 0 et notons À la matrice carrée de taille n : À = fa; ;]. Posons 


di 
M = 1, -A et X — : |. Montrer que l’on a MX — 0. 
so 
b) Notons p1,...,p, les prix des produits des différents secteurs. En supposant qu’il 


n'y a pas de profit, le prix de vente d’une unité du secteur 51 est égal à la somme 
des prix d'achats auprès des autres secteurs, ce qui s'écrit p1 = p20@2,1 ++ *-+Pnüän1. 
Notons P=[p1 p2 ::: pn] la matrice-ligne des prix. Montrer que l’on a PM = 0. 


c) On suppose n=3, a12=1/5, a13=2/3, a1=3/5, a3=8/15, a31=1/3, a3,2=2/3. 
{il Calculer le déterminant et le rang de M. 
li) Résoudre l'équation linéaire MX — 0 et calculer les valeurs relatives 22/x1 et 
z3/1. 
(üi) Résoudre l’équation linéaire PM = 0 (où l’inconnue est le vecteur-ligne P) et 
calculer les valeurs relatives p2/p1 et p3/p1. 


Équilibre de la consommation. Considérons une économie ayant trois secteurs d’acti- 
vité Si, S2,S3 produisant des quantités de biens %1,%2,x3. Comme dans l'exercice 
précédent, la fraction de x; utilisée par le secteur S; est a; ;x;, où (pour i £ 5), 
&i,; est un coefficient caractéristique de cette économie. Notons 1 la demande des 
consommateurs pour le produit du secteur S1, y la demande concernant S2 et y3 
la demande concernant S3. 


a) Écrire les équations qui expriment l'équilibre entre production et consommation 
dans chacun des secteurs. 


b) On suppose a1,2 = 1/4, a1,3 = 1/2, a21 = 1/5, a23 = 1/2, a31 — 2/5 et a32 = 3/4. 
T1 Y1 

y2 |. 
y3 


Écrire ces équations sous la forme MX = Y, où X — ËÉ et Y — 
c) Montrer que la matrice M est inversible et calculer æ1,72,73 au moyen de y1,y2,y3. 


T3 


d) On suppose que la demande des consommateurs pour le produit du secteur S: 
augmente d’une unité. Pour répondre à cette demande, de combien faudra-t-il 
augmenter les productions dans chaque secteur ? 
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8. 


9. 


Un déterminant de matrice antisymétrique. Montrer la formule 


0 x y2 
- E. 5 = (zu — yu + 2t}? 


—z —u —v 0 


Soit le polynôme P = 2° + 2? + az +9, où a est un nombre réel ou complexe. 
a) Montrer que le résultant des polynômes P et P' est (4a + 39)(a? — 10a + 57). 
b) Pour quelles valeurs de a le polynôme P a-t-il une racine multiple ? 


cd) Trouver toutes les racines de P dans le cas a — —39/4. 


@ 10. Calculer les quatre valeurs du nombre complexe q pour lesquelles le système d’équa- 


L 


= 


ND 


; 28 +Q = 0 ; : 
tions a une solution au moins. Résoudre le système pour ces 
{ 2 +g2+1=0 ÿ P 


valeurs de q. 


. Approche numérique d'une équation différentielle. Considérons l'équation différentielle 


d'Airy (x) y”(t) +ty(t) = 0 (utilisée en Physique) et tâchons d’approximer les so- 
lutions y(t). Faisons les calculs sur l'intervalle [—2,5] en des points t; régulièrement 
espacés d’une quantité À > 0. 


a) Montrer que l’on peut approcher les valeurs y(t;) par des nombres y; vérifiant 
les équations Y;-1 — 2y; + Yi+1 + R?t;y; = 0. 

b) Intéressons-nous à la seule solution y(t) de (+) qui passe par l’origine avec une 
dérivée a, donc y(0) = 0 et y(0) — a. Choisissons la subdivision de manière que 
0 est l’un des points t; : il y a un indice p tel que t, — y, — 0. Montrer que dans 
notre approximation, la condition y/(0) = a peut s'exprimer par Yp+1 — Yp-1 = 24h. 

€) Écrire les huit équations obtenues en choisissant A=1 et les points t;=i pour —2<i< 
5. En déduire que les valeurs approchées y; de y(t;) vérifient yo =0, y =2a+y_1 et 


1-30000 Y-2 0 
0 20000 Yi —24a 
0—-11000 y | 24 
0 10100 y3 | | —2a 
0 01110 ya 0 
0 00121 U5 0 


d) Résoudre les équations précédentes. Dans le cas a — 1, des- 
siner la ligne brisée passant par les points (f;, y). 
Ci-contre le graphe de la solution + y(t) sur l'intervalle 
[2,5], pour a = 1. 


. Posons q(x,y) = ax? + bxy+ cy?, À = | . . et P — | P md où a,b,c,p,u 


b/2 ua p+u 
sont des nombres réels. 


a) Montrer que l’on a (*P)AP = (p? + bup + acu?)A. 
q 
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b) Montrer que pour tout vecteur-colonne X = Al on a (:X)AX = ax? + bxy+ cy?. 


c) On considère la transformation linéaire définie par X != PX. En utilisant la ques- 


! 
tion précédente, montrer que si l’on pose X — (| et X'— MI alors on a 


qg(x',y) = (p? + bup + acu?)q(x, y). 


d) On suppose désormais a = 3 et b — c — —2. Calculer le nombre p? + bup + acu? 
pour u = 3 et p = 11. En déduire l'identité q(x’, y’) = q(x, y). 


e) Montrer que les itérés d’un vecteur pol par la transformation X + PX sont les 


vecteurs bel définis par les formules xz,11 = 11%; + 6Yn, Yn+1 = ln + DUn. 


Montrer que si l’on pose (x0,%o) = (2,1) ou bien (x0,yo) = (4,3), alors x» et Yn 


2 


sont des entiers solutions de l'équation 3x? — 2x7y — 2ÿ? — 6. 


f Étudions la courbe (C') d’équation q(x,y)—6 au moyen d’un changement de repère. 
( Calculer les racines {1 et t> de l'équation q(f,1) = 0 et montrer que l’on a 


gx, y) = 3(x — t1y)(x — toy). 


{il Montrer que les vecteurs U; = (1,1) et U2 = (t2,1) forment une base de R° 
et que si l’on note (X,Y) les coordonnées d’un point de R? dans cette base, la 
courbe (C') a pour équation XY — —9/14. En déduire que (C') est une hyperbole 
dont les asymptotes sont portées par les vecteurs U;, U2. Dessiner la courbe (C). 


D'après la question (d), la transformation linéaire X — PX envoie les points de (C) 
dans des points de (C) : les itérés d’un point de (C) sont tous sur (C). 


@ 13. L'inverse d'une matrice est un polynôme en la matrice. Posons M — 


1 1 —1 
1 —2 2. 
—1 2 1 


a) Calculer le polynôme caractéristique de M. Déduire du théorème de Cayley- 
Hamilton que l’on a M(M? —913) +913 = 0 et M! = 13 — (1/9)M?. 
b) Montrer que pour tout nombre z, on a MŸ— 213 — 9[M — (1+2/9)B]. En déduire 
que le polynôme caractéristique de M 3 est PC m(1+2/9), où Cu est le polynôme 


caractéristique de M. 
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Chapitre 6 


Espaces vectoriels 
et applications linéaires 


1. Espaces vectoriels 


Au chapitre 4, nous avons utilisé les combinaisons linéaires de vecteurs de K”. Voici 
d’autres exemples où l’on définit de manière naturelle la somme et le produit par 
un nombre. 


Exemples 
a) Soit Z une partie de R. Si f et g sont des fonctions de 7 dans R, 
- la somme f +g:1—R est la fonction {+ f(t) + g(t); 
- pour tout nombre réel À, le produit Àf : 1 —R est la fonction {+ Af(t). 

b)Si Æ est un ensemble quelconque et si f et g sont des fonctions de Æ dans K, 
ou bien de E dans KP, on définit de même la somme f + g et le produit Àf par 
un nombre appartenant à K. 

Ainsi, la somme de deux suites (w,) et (v.) est la suite de terme général u» + un 
et pour À réel (ou complexe), le produit par À de la suite (u,) est la suite de 
terme général Au. 

c)Si À et B sont des matrices à p lignes et n colonnes, leur somme A + B et le 
produit AA par un scalaire sont des matrices à p lignes et n colonnes. 

d) La somme de deux polynômes à coefficients dans K est un polynôme à coefficients 
dans K, de même que le produit d’un polynôme par un scalaire de K. Dans l’en- 
semble P(K) des polynômes à coefficients dans K, on dispose donc d’une addition 
et du produit par un scalaire. 

Soit d un entier positif et soit P4(K) l’ensemble des polynômes de la forme 
ag2 + ag_12% 7 +. + ax + ao : ce sont les polynômes de degré au plus d et 
le polynôme nul. Le degré d’une somme de polynômes est inférieur ou égal au 
maximum des degrés, et le degré d’un polynôme ne change pas quand on le 
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multiplie par un scalaire non nul; dans l’ensemble P;(K), on a donc encore les 
opérations d’addition et de produit par un scalaire. 


Dans ces exemples, les règles de calcul concernant la somme et le produit par un 
scalaire sont celles qu’on pratique dans l’espace vectoriel K?. Énonçons-les dans le 
cas général d’un ensemble V d'éléments appelés vecteurs. 


i Il existe un vecteur nul 0 tel que u + 0 — 0 + u = u pour tout vecteur u € V. 

ü] On a u+vu=v+u et u + (v+w) = (u +v) +w pour tous vecteurs u,v,w € V. 

ïü) Pour tout vecteur u € V, il existe un vecteur opposé, noté —u, tel que u + (—u) = 
(—u) + u = 0. 

iv) Pour tous vecteurs u,v € V et pour tous scalaires À, € K, on a 


A(u+v)=Au+Av, (Â+uju=Au+uu, A(uu)=(Auju, lu=u. 


Un ensemble V muni d'opérations ayant ces propriétés s'appelle un K-espace vectoriel. 
On démontre facilement que dans un K-espace vectoriel V, on a aussi les relations 
(—lju=-u, Ou—0, 10—0 


et l’'équivalence Au=04—(1=0 ou u = 0). 

Dans un K-espace vectoriel, on définit les combinaisons linéaires de vecteurs et les 
notions de vecteurs indépendants, de vecteurs qui engendrent et de base comme 
nous l'avons fait dans IK?. 


Définitions 
Soit V un K-espace vectoriel et soient w1,...,u\, des vecteurs appartenant à V. 


Un vecteur Au; + our +: --+X,u, s'appelle une combinaison linéaire des vecteurs 


U1,-.., Un: 

Les vecteurs u1,...,u, sont indépendants si l'équation linéaire 
Tiu + Touo +: + Tnün = 0 n’a que la solution 1 = x2 =: = x» — 0. 

Si tout vecteur de V est combinaison linéaire des vecteurs u1...,u,, on dit que 
u1,...,un engendrent V. 

Les vecteurs u1,...,u, forment une base de V si, pour tout vecteur ve V, 


l'équation linéaire æiu; + tous +--: + vyu, = v possède une unique solution. 


Des vecteurs u1,...,u, de l'espace vectoriel V forment une base de V 
si et seulement s'ils engendrent V et sont indépendants. 


Définition 
Soit V un K-espace vectoriel et soit W une partie de V. On dit que W est un 


sous-espace vectoriel de V si le vecteur nul appartient à W et si toute combinaison 
linéaire d'éléments de W appartient à W. 


162 - ESPACES VECTORIELS 


© Dunod -— La photocopie non autorisée est un délit. 


Si W est un sous-espace vectoriel de V, alors W, muni des mêmes opérations que 
V, est un K-espace vectoriel. Voici des exemples d'espaces vectoriels. 


Des espaces vectoriels de fonctions 


a) Étant donné un ensemble E, l’ensemble de toutes les applications de E dans K 
est un K-espace vectoriel, le vecteur nul étant la fonction 0 : E — K définie par 
O(x) = 0 quel que soit re E. 

b) Prenons ÆE = [a,b] (avec a < b) et posons f,(x) = x" pour tout entier n > 0 
(pour n = 0, on a par convention fo(x) = x° = 1). La combinaison linéaire g = 
An fn+An1fn-1+::+Afi+Aofo est la fonction définie par 

g(x) = Ant + Ant ++ Air + Ào, pour tout x € [a, b]. 
Puisque g est une fonction polynôme, elle n’est nulle que si tous ses coefficients 
sont nuls. Dans l’espace vectoriel des applications de [a,b] dans R, les vecteurs 
Jo, f1,..., fn sont donc indépendants. Comme cela est vrai quel que soit n, on 
peut trouver, dans cet espace, des familles de vecteurs indépendants comportant 
autant d'éléments que l’on veut. 

c] L'ensemble des suites (u,) à termes réels est un R-espace vectoriel. Une combi- 
naison linéaire de suites qui tendent vers Ü tend vers 0 : l’ensemble des suites 
réelles qui tendent vers 0 est donc un sous-espace vectoriel. 

d\Si f,g:R—R sont des fonctions dérivables, leur somme {+ f(t) + g(t) est dé- 
rivable ainsi que la fonction {- ÀAf(t) : les fonctions dérivables forment donc un 
sous-espace vectoriel de l’espace vectoriel des fonctions de R dans KR. 


Des espaces vectoriels de polynômes 

— L'ensemble P(K) des polynômes à coefficients dans K est un K-espace vectoriel. 
En faisant des combinaisons linéaires d’un nombre fini de polynômes, on n’ob- 
tiendra pas de polynômes de degré supérieur au plus grand degré des polynômes 
employés : l’espace vectoriel des polynômes ne peut donc pas être engendré par 
un nombre fini de vecteurs. 

 Donnons-nous un entier d positif ou nul. Les polynômes de degré au plus d 
sont de la forme ag + az +:::+ a421 : avec le polynôme nul, ils constituent un 
sous-espace vectoriel de P(K), noté P4(K). Les d+1 polynômes 1,z,...,24 forment 
une base de P;(K). 


Des espaces vectoriels de matrices 


a) L'ensemble #,,» (K) des matrices à p lignes, n colonnes et à coefficients dans K est 
un espace vectoriel. Le vecteur nul est la matrice dont tous les coefficients sont nuls. 


Considérons les matrices E; ; dont tous les coefficients sont nuls, sauf celui en po- 


sition ?,j qui vaut 1. Par exemple, pour p=n—2, on a FE, — L dl: E9 9 = k ‘| 


et tEi1 + y + 2E21 + tEso — É + 
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Plus généralement, les np matrices E;; forment une base (dite canonique) de 
l’espace vectoriel .#, A (K), car pour toute matrice A={[a;;], on a A= 7, dE 
b) La somme de deux matrices carrées symétriques est symétrique et si l’on multi- 
plie une matrice symétrique par un scalaire, elle reste symétrique. L'ensemble des 


matrices symétriques de taille n est donc un sous-espace vectoriel de 4, (K). 

Pour n—2, la matrice symétrique générale s'écrit F, | =T [5 | +y Ë ‘| +i Lo ‘| : 

les trois matrices Æ3 1, Æ1 9 + E2 1, E22 forment donc une base de l’espace vectoriel 

des matrices symétriques de taille 2. 

Plus généralement, l’espace vectoriel des matrices symétriques de taille n a pour 

base les matrices E;; et E;7+ EX; pour 1<i<net1<3j<k<n; cette base 
n(n—1) n(n+1) 


comporte n + D — à éléments. 


1.1 Bases et dimension 


Les résultats que nous avons démontrés dans l’espace vectoriel K? restent vrais dans 
un K-espace vectoriel possédant une base e1,...,e,. Voici un théorème permettant 
de construire des bases. 


Théorème de la base incomplète. Soit V un K-espace vectoriel engendré par un 


nombre fini de vecteurs v1,...,v, et soient e1,...,e,, des vecteurs indépendants appartenant 
à V. Alors il existe une base de V de la forme e1,...,e,f1....,fr, où les f; sont certains 
des vecteurs vi,...,Ug. 


Corollaire. Tout espace vectoriel engendré par un nombre fini de vecteurs possède une base. 


Démonstration du théorème. Si chacun des vecteurs v; est combinaison linéaire de e:, 
e2,...,en, alors tout vecteur de V est combinaison de e1,62,...,e,, car il est combinaison 
des v; : dans ce cas, e1,62,...,e, est une base de V. Supposons que certains vecteurs 
v; ne sont pas combinaison linéaire de e:,...,e, et complétons e:,e2,...,e, avec le plus 
grand nombre possible de vecteurs f1,...,fX pris parmi les v; et de telle manière que 
C15e..;Cm fi... fr restent indépendants. Si v, est un vecteur non sélectionné, alors par cons- 
truction, €1,...,€n, f1,..., fr, v; ne sont pas indépendants, donc v; est combinaison linéaire 
de €1,...,en, f1,..., fr. Tous les vecteurs v; sont donc combinaison de €e:,...,en, f1,..., fx 
et comme ci-dessus, on en déduit que les vecteurs e1,...,e,,f1,...,fx engendrent V. Comme 


ces vecteurs sont indépendants, ils forment une base de V. = 


Propriétés des bases. Nous les avons déjà énoncées dans le cadre de l’espace 
vectoriel K? ; les démonstrations sont les mêmes, en utilisant une base quelconque 
de V au lieu de la base canonique de K? (chapitre 4, paragraphe 3). 

Soit V un K-espace vectoriel engendré par un nombre fini de vecteurs. 


1) Toutes les bases de V ont le même nombre d'éléments. Ce nombre s'appelle la 
dimension de V et se note dim V. 
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2) Supposons que V est engendré par n vecteurs. Alors on a dimV <n et si 
dim V = n, alors ces vecteurs forment une base de V. 


3] Supposons que wi,U»,...,u4 sont des vecteurs indépendants appartenant à V. 
Alors on a dim V > q et si q = dim V, alors ces vecteurs forment une base de V. 

4) Si W est un sous-espace vectoriel de V, alors dimW <dimV et l’on a l’équivalence 
W=V = dimW = dimV. 

Si un espace vectoriel est engendré par un nombre fini de vecteurs, on dit qu'il est 

de dimension finie. 


Exemples. 
Les polynômes 1,2,...,2" forment une base de l’espace vectoriel P,(K) des 
polynômes de degré inférieur ou égal à n : on a donc dim P,(K) = n+1. 


Les np matrices canoniques E;,; forment une base de l’espace vectoriel 4, n(K), 
donc dim} n(K) = np. 


1.2 Coordonnées d'un vecteur dans une base 


Soient V un K-espace vectoriel et (e1,e2,...,e,) une base de V. 
Tout vecteur x EV s'écrit de manière unique sous la forme 7—%16e1+2%2e2+--:+%pep, 
où les x; sont des scalaires de K. 


Définition 
Les nombres %1,%2,...,2, s'appellent les coordonnées du vecteur x dans la base 
(e1,e2,...,ep). _ 
\ 22 
À tout x € V, associons le vecteur-colonne X = | . formé des coordonnées de x 
dans la base (e1,e2,...,e,). On a X € KP. ". 


Soient x et y des vecteurs appartenant à V. 

Si x a pour coordonnées X et si y a pour coordonnées Y, alors x +7 a pour 
coordonnées X + Y. 

Pour tout scalaire À, le vecteur Àx a pour coordonnées ÀX. 

Les calculs dans l’espace vectoriel V se traduisent donc sur les coordonnées par les 

mêmes calculs dans K?. On en déduit les propriétés suivantes. 

Propriété 1. Des vecteurs ui, u2,...,u, de V sont indépendants si et seulement si 
leurs vecteurs de coordonnées X:,X2,...,X, sont indépendants dans K?. 

Propriété 2. Des vecteurs u1,u2,...,u, engendrent V si et seulement si leurs vecteurs 
de coordonnées X5,X2,...,X, engendrent K?. 

Propriété 3. Soient ui,u,...,u, des vecteurs appartenant à V, de coordonnées 
X1,X0,...,X,. Les vecteurs u1,u2,...,u, forment une base de V si et seulement 


si la matrice carrée de colonnes X5,X2,...,X, est de rang p, c'est-à-dire si et 
seulement si det(X1, X2,..., X,) # 0. 
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Changement de base 


Supposons que = (e1,62,...,en) et #' = (ei,e,,...,e,) sont des bases de V. 
Définition 
Écrivons en colonne les coordonnées de el ,e,,... js dans la base Z. On obtient 


une matrice carrée de taille p, appelée la matrice de passage de la base & à la base #7. 


Proposition. Soient u un vecteur appartenant à V, X —(x1,22,...,%) ses coordon- 
nées dans la base 8 et X'—(x,2,,...,x,) ses coordonnées dans la base 7. On a 
X = PX", où P est la matrice de passage de la base 8 à la base B7. 


Démonstration. Dans la base #’=(e’,e,,...,e,), le vecteur-colonne des coordonnées de e; 
est E;, le i-ème vecteur canonique de K?. On sait que le produit PE; est la i-ème colonne de 
P. Par définition de la matrice de passage, PE; est donc le vecteur-colonne des coordonnées 
de e; dans la base Z. Puisque u = ze; +---+x,e,, les coordonnées de uw dans la base 


sont 2 PE +. +ax PE, = P(aiE1 +: +2, Ep) = PX7. ü 


Une matrice de passage est toujours inversible : si P est la matrice de passage de 
B à PB, alors P | est la matrice de passage de ' à Z. 


Exemple. Les vecteurs €! — (1,—1,2), e, = (1,0,1), e, — (2,1, —1) forment une 


11 2 
base de R°, car le déterminant | —1 O 1|— —2 est différent de 0. La matrice de 
2 1 —1 
11 2 
passage de la base canonique de IR° à la base Z'—(e,e,e) étant P=|-10 1}, 
2 1 —1 


les coordonnées d’un vecteur (r,y,2) € R° dans la base #’ sont données par le 
vecteur-colonne X’ tel que X — PX", c'est-à-dire X’= P 1X.Ona 


de ” x'+y +22 =x x'+y +22 =x 
F <Plyl —r+r/=y = +32 =r+y 
7 # 2x +y —2 = 2z —y—-57 = -2r+2 
x'+y +22 =x 22 =x—-3y—2 
= y +32 =r+y = 4 2ÿ = —x + 5y +32 
22 =x-y—2 22 =x-y—2 


On a donc (x,y,z) = =(x — 3y — z)e, + SE + 5y + 32)eh + CE 


1 
2 


Remarque 
Quand on connaît les coordonnées d’un vecteur dans une base, pour calculer ses 
coordonnées dans une nouvelle base, il faut inverser la matrice de passage. 
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2. Applications linéaires 


Soit M une matrice à p lignes et n colonnes. Pour tout vecteur-colonne X € K”, Le pro- 
duit MX est un vecteur-colonne de K?. D'après les propriétés du produit de matrices, 
on a les formules suivantes, pour tous vecteurs-colonne X,X’EK” et pour tout scalaire 
ÀEK : M(X+X')=MX+MX'et M(AX)=AMX. En notant f:K”—K? l'application 
X + MX, ces relations s'écrivent f(X + X') = f(X) + f(X’) et F(AX) = Xf(X). 


Définition 
Soient V et V’ des K-espaces vectoriels et soit f : V — V’ une application. On 


dit que f est une application linéaire si pour tous vecteurs u,v € V et pour tout 
scalaire }ÂEK,on a f(u+v) = f(u) + f(v) et f(Au) = \f(u). 


Propriétés des applications linéaires 


1]Si f est une application linéaire de V dans V/, alors pour toute combinaison 
linéaire de vecteurs de V,on a 


fOiu + Aou +: + pur) = À fui) + Arf(u2) +: + Ag fur). 


L'image par f d'une combinaison des u; est la combinaison correspondante des f(u:). 


2) Supposons que Z = (e1,...,e,) est une base de V. Une application linéaire 
f:V — V' est entièrement déterminée par les vecteurs v, = f(e1),...,v!, = f(en) 
de V’ : si un vecteur x € V a pour coordonnées x1,...,1, dans la base , on 


aen effet f(x) = iv +: + mu, 
3)Si f : V — V' est une application linéaire, alors f(0) = 0. 


En effet, si u est un vecteur quelconque de V, Ou — 0 est le vecteur nul de V et 
f(0) = f(Ou) = 0 f(u) = 0 est le vecteur nul de V”. 


Une application linéaire de V dans lui-même s'appelle une transformation linéaire de V. 


Exemples 


Si M est une matrice à p lignes et n colonnes, l'application X -— MX est une 
application linéaire de K” dans K?. 

> L'application qui à tout polynôme associe son polynôme dérivé est une appli- 
cation linéaire P,,(K) — P,_1(K). La multiplication par un polynôme À fixé est 
l'application linéaire P(K) — P(K) définie par P- AP, pour tout P € F{K). 

— Donnons-nous une fonction continue w:R—R et pour toute fonction {+ y(t) deux 
fois dérivable sur R, posons D(y) = y” +wy, où wy désigne la fonction produit 
te w(t)y(t). Si y et z sont des fonctions deux fois dérivables, on a (y+2)"=y"+2" 
et w(y+z2) =wy+wz, donc D(y+z) = D(y)+D(à) ; de même, D(Ay) = AD(y) pour 
tout AE R. 

En notant V l'espace vectoriel des fonctions de R dans R et W le sous-espace 
vectoriel des fonctions deux fois dérivables, l'application D:W—V est donc linéaire. 
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Soit V l’espace vectoriel des fonctions continues sur le segment [a,b] et soit 
#:{a,b] —R une fonction donnée. D'après les propriétés de linéarité de l'intégrale, 

b 
l'application f + | f(t)o(t) dt est une application linéaire de V dans R. 

a 


cos 0 —sin 0 
sin0  cosû 
par X — MyX est la rotation de centre l’origine et d'angle 0. 


Une rotation. Posons M) — | | . La transformation linéaire de R? définie 


Le] — | = __fæcosé — ysin@ 
Posons [] = X et [re] = MX = 
complexes z=x+iy et z! = x +iy, il vient en effet 


| . En introduisant les nombres 


2! = x(cos 0 + à sin 0) + à y(cos 0 + sin 0) = (x +iy)et? = zei0, 
On sait que cette formule traduit, sur les affixes des points, la rotation de centre 
l'origine et d'angle 0 (page 41). 


Une projection. Soit P un plan vectoriel de R°. Choisissons une base (e1,e2) de P 
et un vecteur €; n’appartenant pas à P. 
Soit p la projection sur le plan P dans la direction es. 
On a p(ei) = e1, p(e2) = e2 et p(ez) = 0. Puisque p est une 
transformation linéaire, cela détermine le projeté d’un vecteur 
quelconque : pour tout vecteur ze + yes + ze3 de R',onaen 
effet p(rei + yer + zez) = xp(e1) + yp(e2) + zp(es) = te + yes. 


2.1 Matrice d'une application linéaire 


Soient V et V’ des K-espaces vectoriels de dimension n = dimV et p = dim V”. 
Donnons-nous une base #—(€1,62,...,e,) de V et une base #'—(e',es,...,e,,) de V”. 
Soit f : V — V’ une application linéaire. 

Formons la matrice M dont la j-ème colonne est constituée des coordonnées de f(e;) 
dans la base #7”. Si f(e;)=a1je; +a2jes +: -+apje, pour tout j—1,2,...,n, on obtient 


fe) f(e2) --- f(en) 


@i1 12 ‘'' in < 

M = | Gu Ga An €2 
Apl Ap2 ‘‘* à ! 

pl p2 pn Ep 


Définition 
La matrice M s'appelle la matrice de l'application linéaire f dans les bases # et #7. 
Si V=V'et #—#7", on dit simplement que M est la matrice de f dans la base Z. 
T1 
Soit v un vecteur appartenant à V, de coordonnées X = | : | dans la base Z. Puisque 


Tn 
U= tie +-+Tnen, on a légalité f(v)=x1f(e1)+x2f(e2)+:--+xhf(en) dans l’espace 
vectoriel V”. Prenons les coordonnées de chaque membre dans la base #”, en notant Y le 
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vecteur-colonne des coordonnées de f(v). Par définition de la matrice M de f, les coor- 
données de f(e;) forment la j-ième colonne de M ; en appelant M; cette colonne, il vient 
Y=xM + to Mo AL + Tn Mn = ME: +22ME2 ess +Xn M En , car M; =ME; 
=M(x1E1 +29 E2 +. +TnEn) =MX. 


Proposition. Soit M la matrice d'une application linéaire f : V — V' dans des bases 
B et B'. Si le vecteur v € V a pour coordonnées X dans la base B, alors f(v) a pour 
coordonnées MX dans la base B. 


Sur les coordonnées des vecteurs, l'application f se traduit par 
l'application X + MX de K” dans K?. 


Soit f une transformation linéaire de V et soit w: V — K” la bijection qui à tout 
vecteur v € V associe ses coordonnées X dans une base Z. Notons L : K” — K” la 
transformation X + MX, où M est la matrice de f dans Z. On obtient L à partir de 
f par le changement de référentiel 4 (page 24), autrement dit : wo fow l=L. 


f f 
V V v f(v) 
? ? p p 
K° ——K” X — MX 


Exemple. Soit a un nombre réel. Pour tout polynôme P(2), posons f(P)=zP"+aP. 
Si P est de degré n, alors zP" est de degré n—2+1—n—1, donc f(P) est de degré 
n si a 0, de degré n—1 si a = 0. On définit ainsi une application f : P, — P, et 
comme la dérivation est une opération linéaire, f est linéaire. 
Supposons n — 3 et calculons la matrice de f dans la base (1,2,2?,z°) de l’espace 
vectoriel Ps. On a f(1)=a, f(z) = az, f(2?)=2:+a2 et f(25) = 62? + a. 
a000 
La matrice de f dans la base (1,2,2?,2°) est donc : ü - 
000a 


Remarques 

Si V est un K-espace vectoriel de dimension n, alors 

toute transformation linéaire de V a une matrice carrée de taille n; 

- dans n'importe quelle base de V, la matrice de la transformation identité est la 
matrice unité J,. 


2.2 Calcul sur les applications linéaires 


Soient V et V’ des K-espaces vectoriels. Les propriétés suivantes sont immédiates. 
Si f et g sont des applications linéaires de V dans V”, la somme f+giur f(v)+g(v) 

est une application linéaire de V dans V”, de même que l'application Af:vr \f(v). 
La composée de deux applications linéaires est linéaire. 
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Si f est une application linéaire bijective, la bijection réciproque est une application 
linéaire. 


Supposons maintenant que # est une base de V et 4’ une base de V’. 


Proposition. Soient f et g des applications linéaires de V dans V', de matrices M et 
N dans les bases B et B7. 


i) L'application linéaire f + g a pour matrice M + N et f a pour matrice ÀM. 


ü) Supposons dim V = dim V”. L'application f est bijective si et seulement si la matrice 
M est inversible et dans ce cas, la matrice de f-! dans les bases B' et B est M. 


Démonstration. La propriété (i] est évidente. Supposons dim V = dimV’=n. Pour tous vec- 
teurs ve V et v'E VV, la relation v’ = f(v) équivaut à X’= MX, où X est le vecteur-colonne 
des coordonnées de v dans Z et X” celui des coordonnées de v’ dans 7”. L'application f est 
donc bijective si et seulement si l'application X + MX de K” dans K” est bijective. D’après 
la proposition page 138, on en déduit que f est bijective si et seulement si M est inversible. 
Dans ce cas, on a les équivalences v = f-l(v’) v'= f(v) X'=MX X=M IX, 
donc la matrice de f-! dans les bases #/ et Z est M1. = 


Proposition. Soient f,g:V — V des transformations linéaires de V. Si f et g ont 
pour matrice M et N dans la base #, alors f o g a pour matrice MN dans la base #. 


Démonstration. Posons n = dim V. Soient v € V et X € K” le vecteur-colonne des coor- 
données de v dans la base Z. Les coordonnées de g(v) sont données par le vecteur-colonne 
Y = NX et les coordonnées de fo g(v) = f(g(v)) sont données par Z = MY. Puisque 
Z = M(NX)=(MN)X, la matrice de go f dans la base Z est MN. ü 


Exemples 
Dans KR?, la rotation de centre l’origine et d'angle 0 est X + M(8)X, où 
M(0) = Fe P- Si l’on compose cette rotation avec une rotation de 
sing cosô 
même centre et d’angle 0’, on obtient la rotation d'angle 4’ +0. Par conséquent 


M(9')M(0) = M(4' +0). On en déduit que pour tout entier n > 1, on a 
(M(6))" = M(n6) et (M(6)) * = M(-6) = '(M(8)). 


Soit P un plan vectoriel de R*, de base (e1,e2), et soit e; un vecteur orthogonal à 
P : si P a pour équation ax +by+cz=0, le vecteur e3 = (a,b,c) convient. Notons 
p:R°—R° la projection orthogonale sur P, donc p(xe; + yes + 263) = ve + yes 


100 
(figure page 168). La matrice de p dans la base (e1,e2,e3) est M = D 1 dl 
Puisque po p = p, on en déduit M? = M. 000 


Changement de base 


Soient Z et #' des bases du même espace vectoriel V de dimension n et soit 
P E AMh(K) la matrice de passage de Z à #7" (définition page 166). 
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Formule de changement de base. Soit f:V — V une transformation linéaire. Si 
M est la matrice de f dans la base B, la matrice de f dans la base B' est PMP. 


Démonstration. Tout vecteur v € V a des coordonnées X dans la base Z, des coordonnées 
X' dans la base Z” et l’on a X = PX’. Notons Y les coordonnées de f(v) dans la base 
et Y' les coordonnées de f(v) dans #” de sorte qu’on a aussi Y = PY'. Puisque M 
est la matrice de f dans la base Z, on a Y = MX et il vient Y'=— P-1Y = P-!(MX) — 
(P-1M)(PX') = (P-IMP)X'. La matrice de f dans la base 7” est donc PMP. = 


Un changement de base s'exprime par un changement de coordonnées (page 24) : 


par le changement de coordonnées X'= P7YX, la transformation 
X+ MX de K” devient X'+ (P!MP)X". 


Polynôme caractéristique d'une transformation linéaire 


Soit f:V—V une transformation linéaire, de matrices M et M' dans les bases Z et Z. 
Rappelons que nous avons défini le polynôme caractéristique de M (page 151) : c’est 
le polynôme Cw(z2) = det(M — z1,). Puisque M'= P-IMP, où P est la matrice de 
passage de 8 à B',ona M'—-21,=P IMP-P-1z1I,P = P (M -—21,)P. Comme 
le déterminant d’un produit de matrices est le produit des déterminants, on en déduit 
Cu = det(M'— 214) = det[P (M — z1,)P] = det(P7*) det(M — z1,) det P 
= det(M — z1,) det(P7!)det P = Cm(z), car det(P7!) = (det P) !. 


Si des matrices représentent la même transformation linéaire dans des 
bases différentes, elles ont le même polynôme caractéristique. 


Le polynôme Cry ne dépend donc que de la transformation f. 
Définition 
Si la transformation f a pour matrice M dans une base de V, le polynôme C 
s'appelle le polynôme caractéristique de f et se note C7. 


Pour calculer le polynôme caractéristique d’une transformation f, on peut utiliser la 
matrice de f dans n'importe quelle base. 


Conséquence. Comme le polynôme caractéristique ne dépend que de f, chacun 
de ses coefficients ne dépend que de f. Puisqu’on a 
Ce) = (1) 2 + (1) tr M)2 lt... +ouz+ det M, 
on en déduit que 
le déterminant de M ne dépend que de f : on pose det f = det M. 
la trace de M ne dépend que de f : on pose tr f = tr M. 
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2.3 Noyau et image d'une application linéaire 


Soient V et V' des K-espaces vectoriels et f : V — V’ une application linéaire. 
L'ensemble N = {u € V | f(u) = 0} est un sous-espace vectoriel de V. 
Le vecteur nul de V appartient à N, car f(0) = 0. De plus, si u et v appartiennent à 
N,ona f(u+v)= f(u)+ f(v)=0+0=0 et pour tout ÀEK, f(Au)=Af(u)=A0=0, 
donc u +v et Àu appartiennent à N. 
— Soit W un sous-espace vectoriel de V. L'ensemble f(W) des vecteurs f(w), où 
w parcourt W, est un sous-espace vectoriel de V”. 
En effet, si v! et v, sont des vecteurs de la forme v! = f(w1) et v, = f(w2), alors 


w1 + w2 EW et vi +uv, = f(w1 + w2) est bien image par f d’un vecteur de W ; de 
même, Àw appartient à W et Avi = f(Aw:). 


Définitions 

Soit f : V — V' une application linéaire. 

Le sous-espace vectoriel de V formé des vecteurs v € V tels que f(v) = 0 
s'appelle le noyau de f et se note Ker f. 

L'image de l'application f, c'est-à-dire l’ensemble f(V), est un sous-espace 
vectoriel de V’ noté Im f. 


Lorsque les espaces vectoriels sont de dimension finie, le calcul matriciel permet de 
trouver les vecteurs du noyau et de l’image : on utilise pour cela la proposition 
suivante. 


Proposition. Supposons que B et B' sont des bases de V et V'. Soit f: V — V' une 

application linéaire et soit M la matrice de f dans ces bases. 

— Un vecteur v € V est dans Ker f si et seulement si ses coordonnées X° sont solution 
du système linéaire MX = 0. 

Un vecteur v' € V' est dans Im f si et seulement si ses coordonnées sont combinaison 
linéaire des vecteurs-colonne de M. 


Corollaire. Supposons V et V' de dimension finie. On a les égalités : 
i) dim Ker f = dimV —-rg M; 

ü) dim Im f =rg M; 

ü) dim Ker f + dimlm f = dimV (formule de la dimension) 


Démonstration. Les solutions de l'équation MX = 0 forment un sous-espace vectoriel de 
dimension n—r,où n=dimV et r=rgM (résultat 2 page 114). D’après les propriétés page 165, 
ce sous-espace vectoriel a la même dimension que le noyau de f, d’où (i]. Posons dim V7” = p. 
Par définition de la matrice de f, la dimension de Im f est celle du sous-espace vectoriel de 
K? engendré par les colonnes de M. D'après le théorème page 137, cette dimension est égale 
au rang de M, ce qui montre [ii]. L'égalité (iii) résulte immédiatement de (i) et (ii). [| 


172 - APPLICATIONS LINÉAIRES 


© Dunod -— La photocopie non autorisée est un délit. 


Corollaire. Soient V et V' des espaces vectoriels tels que dim V = dim V' et soit 
f:V — V' une application linéaire. 


 f est bijective si et seulement si Ker f = {0}. 


On a les équivalences : f est bijective — Im f = V’ dim(Im f) = dim V”. 


Démonstration. Choisissons des bases de V et V’ et soit M la matrice de f. Puisque 
dimV = dimV’=n, la matrice M est carrée de taille n. D’après une proposition page 170, 
l’application linéaire f est bijective si et seulement si M est inversible. Utilisons la proposi- 
tion page 138 : M est inversible si et seulement si le système linéaire MX — 0 a pour seule 
solution X — 0, ce qui équivaut à Ker f = {0}. D'après la même proposition, M est inversible 
si et seulement si rg M = n, ce qui équivaut à dim(Im f) = dim V”, ou encore à Im f = V” 
puisque Im f est un sous-espace vectoriel de V” (propriété (4) page 165). ü 


Diagonalisation 


Dans ce paragraphe, 
— V est un K-espace vectoriel de dimension n et (e1,e2,...,e.) est une base de V'; 
— f est une transformation linéaire de V et M est la matrice de f dans la base 
(e1, C2... En): 
Définitions 
Un vecteur v non nul tel que f(v) est colinéaire à v s'appelle un vecteur propre de 


f. Si v est un vecteur propre, le scalaire À€ K tel que f(v) = Av s'appelle la valeur 
propre associée. On dit aussi que v est vecteur propre pour la valeur propre À. 


Exemple. Pour la transformation de R? définie par 

F,y)= (x — y/2,-x/2+ y) : 

-ona f(1,1)—(1/2)(1,1), donc le vecteur u— (1,1) 
est vecteur propre pour la valeur propre 1/2; 


- le vecteur w = (1,—1) est propre pour la valeur 
propre 3/2, car f(w) = (3/2)w. 

La droite dirigée par v est transformée en elle-même, 

de même que la droite dirigée par w. 


Exemples 

Si r:R?— R? est une rotation de centre l’origine et d'angle 0 € [0,27 et si v est 
un vecteur non nul, l’angle v,r(v) a pour mesure Ÿ : une rotation d'angle différent 
de 0 et de T n’a donc pas de vecteur propre. 

Soit p:R°— R° la projection orthogonale sur un plan vectoriel P (figure page 
168). Pour tout vecteur v € P, on a p(v) = v : tout vecteur non nul du plan P est 
donc vecteur propre de p, avec 1 comme valeur propre. Soit u un vecteur non 
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nul et orthogonal à P ; alors p(u) est le vecteur nul, donc p(u) — Ou : le vecteur 
u est vecteur propre pour la valeur propre 0. 


— D'une manière générale, les éventuels vecteurs non nuls de Ker f sont les vecteurs 
propres de f pour la valeur propre 0. 


Supposons que À est une valeur propre de f. Pour tout x€E V, posons g(x)= f(æ)—Ax, 
ce qui définit la transformation linéaire g = f — Àidy. Par hypothèse, il existe un 
vecteur propre v tel que f(v) = Av, donc g(v) — 0. Le vecteur v est non nul et 
appartient au noyau de g : d’après le dernier corollaire du paragraphe précédent, 
l'application g n’est donc pas bijective. 

Réciproquement, si À est un scalaire et si la transformation f — Aidy n’est pas 
bijective, il existe un vecteur v non nul dans le noyau de f — Aidy. On a alors 
O=(f—Aidy)(v) = f(v) — Av, donc f(v) = Àv et À est une valeur propre. Puisque 
la matrice de f — Àidy est M — ÀI,, on en déduit : 


un scalaire À € K est une valeur propre de f si et 
seulement si la matrice M — ÀT, n'est pas inversible. 


Rappelons que, par définition, le polynôme caractéristique de f est C';(z)=det(M—21,) 


(page 171). Puisque la matrice M — \I,, est inversible si et seulement si son déterminant 
est non nul, on a la proposition suivante. 


Proposition. Les valeurs propres de f sont les nombres À € K qui sont racines du 
polynôme caractéristique de f. 


Le polynôme caractéristique de f étant de degré n, f possède au plus n valeurs 
propres. 


Remarques 
— Si M est une matrice triangulaire, les valeurs propres de f sont les nombres situés 
sur la diagonale de M. 
En effet, si M = [m;;] est triangulaire, alors M — z1,, aussi, donc det(M — z1,) est 


le produit (m11 — z)(m922 — z)--:(mun — z) des termes diagonaux. 


Si { est un scalaire, la matrice M —1{1, est inversible sauf pour un nombre fini 
de valeurs exceptionnelles de {, constituées précisément des racines du polynôme 
caractéristique de M. 

Si toutes les racines du polynôme caractéristique de M sont dans K, la somme 
des valeurs propres de M est égale à la trace de M. 

Si ces racines sont À1,...,,,, alors (—1)"C =(z—-1)-:-(2—X,) (page 171). Puisque 
le coefficient de 2°! est — tr M, il vient — tr M = —X\;—)2—...—X,. 
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1/3 À 


ls el) + 3 ( 1) ( à 
—1/2 = y Pre 


Les valeurs propres de f sont 1/2 et 3/2. Pour calculer, par exemple, les vecteurs 


1 | 


Exemple 1. Reprenons la transformation f de R? de matrice M = | 


(exemple page 173). On a 


det(M—21) — 


propres pour la valeur propre 1/2, on résout le système linéaire (u — 1n) X =0: 
les solutions sont les vecteurs {(1, 1). 


cos 0 — sin 0 


Exemple 2. Posons Mo— . Co50 


de M est 
Cu = det(A — zl) = 


| , où 0<0<2r. Le polynôme caractéristique 


cosÜ — z —sin0 


ing  cosg—2l—(c080— 2) +sin?0. 


Supposons Ô différent de 0 et de 7, c’est-à-dire sin0 0. Alors Cu n’a pas de racine 
réelle, ce qui correspond au fait que la rotation d'angle 0 n’a pas de vecteur propre. 

- Supposons 0 — 0. On a Mo = D, le polynôme caractéristique est (1— 2)? et la 
transformation de R? définie par X — MX est l’identité : tout vecteur non nul 
de R? est propre pour la valeur propre 1. 

- Supposons 0 = x. On a M; = —1:, le polynôme caractéristique est (1 + z)? et la 
transformation de R? définie par X + M,X est —idm : c'est la symétrie par 
rapport à l’origine. Tout vecteur non nul de R? est propre pour la valeur propre —1. 

Soit f: C? — C? la transformation définie par X + MoX. Puisqu'on a Cu = 
22—(2cos0)2+1=(2—e9)(2—e7 0), les valeurs propres de f sont ef? et e-0.Ona 


en CSN ét M|_il=e"| | 


sin 0 + icosÿ î — À 
donc |_;] est vecteur propre de f pour la valeur propre eŸ° et le vecteur 
conjugué h est propre pour la valeur propre conjuguée e- ©. 
Etude des vecteurs propres 
Proposition. Supposons que À, 2,...,)x sont des valeurs propres deux à deux diffé- 
rentes. Si w1,u2,...,ux sont des vecteurs propres pour ces valeurs propres, alors u1,u2,...,ux 


sont indépendants. 


Démonstration. Si k = 1, la propriété est vraie car uw est un vecteur non nul. Raisonnons 
PIOP 
par récurrence en supposant que la propriété est vraie pour À — 1 vecteurs. Supposons que 


les vecteurs u1,Uu2,...,ux satisfont la relation 

(1) Tu + Tou2 +: + Trur = 0. 

Par hypothèse, on a f(u;) = Àju;, donc en appliquant f à l'égalité (1), il vient 
(2) Ti iüs + To)ouo ++: + re XEUx = 0. 
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Multiplions (1) par À4 et soustrayons à (2) : 

æ1 (Xi — Àg)ui + to(Ao — Àgjuo +: + mp1 (A1 — ÀAg)ux-1 = 0. 
Les vecteurs w1,...,ux-1 sont indépendants. D’après l'hypothèse de récurrence, on a donc 
di(li — Àr) = 0 pour tout à = 1,...,k — 1. Puisque À; # À4, on en déduit x; = 0 pour tout 
i=1,...,k—1. L'égalité (1) devient æ£ux = 0, d'où xx =0, car ux n’est pas le vecteur nul. 


Définition 
Soit À une valeur propre de f. Le noyau de la transformation f — Aidy s'appelle 
le sous-espace propre pour la valeur propre À et se note V(À). 


Un vecteur v est dans V(A) si et seulement si f{v) — Au = 0 : les vecteurs propres 
de f pour la valeur propre À sont exactement les vecteurs non nuls appartenant à 
V(À). Un sous-espace propre contient donc des vecteurs non nuls. 


Notation. Si À est une valeur propre de f, notons m{À) la multiplicité de À 
comme racine du polynôme caractéristique de f (page 47). Si À est racine simple du 
polynôme caractéristique, on dit que c'est une valeur propre simple. 


Proposition. Pour toute valeur propre À de f, on a dim V(À) < m(). 


Démonstration. Soient v1,v2,...,v4 une base de V(À). Si d=n, alors V(A)=V : dans ce cas, 
tous les vecteurs non nuls de V sont propres avec À pour valeur propre; on a alors f = \idy, 
Cy(z)=(À1— 2)" et la multiplicité de À est n. Supposons maintenant d<n. D'après le théorème 
de la base incomplète (page 164), il existe une base de V de la forme (v1,..., Ua, Wa+1,...,Wn). 
Puisqu'on a f(v;) = Av; pour i = 1,...,d, la matrice de f dans cette base est de la forme 


/ À * a : 2 ! 
M = , où N est une matrice carrée de taille n — d. 


On a M'—21, = et d’après la proposition page 151, il vient 
0 N—21,-a 


Cy(z) = det(M” — zI,) = det[(A-2)1a] det(N — zln_a) = (A - 2) det(N — 21n_4). 


La racine À de C; a donc une multiplicité au moins égale à d. o 


Transformation diagonalisable 


Proposition. Pour que la matrice de f dans une base soit diagonale, il faut et il suffit 
que les vecteurs de cette base soient tous propres. Dans ce cas, le j-ème coefficient diagonal 
est la valeur propre associée au j-ème vecteur de base. 


Démonstration. Supposons que, dans la base (ui, u2,...,u,), la matrice de f est la ma- 
trice diagonale diag(A1,)2,...,À,). Puisque la j-ème colonne de cette matrice est À,E;, on 
a f(u;) = Àju;, donc les vecteurs de la base sont propres. Réciproquement, supposons que 
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les vecteurs de base u1,u2,...,u, Sont propres, avec valeurs propres associées À1,2,...,À,. 
On a f(u;) = Àju;, donc la j-ème colonne de la matrice de f dans cette base est À,E; : la 
matrice de f est donc diag(A,)2,..., A»). = 


Définition 
La transformation linéaire f est diagonalisable s’il existe une base de V dans laquelle 


la matrice de f est diagonale. Une matrice M € M, (K) est dite diagonalisable si 
la transformation X - MX de K” est diagonalisable. 


Une transformation linéaire f est diagonalisable si et seulement s'il existe 
une base de V formée de vecteurs propres de f. 


Exemple. Soient 11 — 


113 
0 2 1 et f : R° — R° la transformation X + MX. 
FO l—z 1 3 

Le polynôme caractéristique de f est Cr =| 0 2-2 3 |—(1-2:)(2-2).1 

0 0 1-2 
y a deux valeurs propres : les nombres 1 et 2. 
i) Puisque la première colonne de M est E1, on a ME — E1 donc le vecteur E: 
est propre pour la valeur propre 1. 


[0 13 0 
iOnaM-l=|01 1 et le vecteur Uo = 1 est solution du système linéaire 
[000 —1 
(M — I13)X = 0. On a MU: = Un, donc U est propre pour la valeur propre 1. 
[—11 3 1 
ii) On a M —-213— 00 3]|etle vecteur U3= d est solution du système linéaire 
0 0 —1 0 


(M — 213)X = 0. On a MUz = 2U3, donc Us est propre pour la valeur propre 2. 
Les vecteurs E1,U>,U3 étant indépendants, ils forment une base de R°. La trans- 
formation f est donc diagonalisable et dans la base (Er, Un, Ua), la matrice de f est 


100 
0 1 0 | = diag(1,1,2). 
002 

Critère de diagonalisation. Pour que f soit diagonalisable, il faut et il suffit que 
le polynôme caractéristique de f ait toutes ses racines dans K et que pour toute racine À 
de Cf, on ait dim V(A) = m{(À). 


Démonstration. Supposons que le polynôme caractéristique a toutes ses racines À1,..., 4 
dans K, donc C;=(A 2)" (x, —2)m02)...()3 2) 0), Choisissons une base Z, du sous- 
espace propre V(À;) et soit 7 la réunion de ces bases. Une combinaison linéaire de vecteurs de 
est de la forme vi +U2+---+v7, où v; est combinaison des vecteurs de Z;, donc v;e V(;). 
Supposons v1+v2+::-+ux=0. Puisqu’un vecteur non nul de V(A;) est un vecteur propre pour 
\;, on en déduit que tous les vecteurs v; sont nuls, en utilisant la proposition page 175. Il s’en- 
suit que dans l'expression de v; comme combinaison des vecteurs de Z;, tous les coefficients 
sont nuls, car les vecteurs de 3; sont indépendants. Aïnsi les vecteurs de Z sont indépendants. 
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Après ce préliminaire, montrons que la condition est suffisante. Supposons À;€K et dimV(A;)= 
m(x) pour tout à. Chaque base #; possède m(À;) vecteurs, donc le nombre de vecteurs de 
Best m(l) +---+m(Ax) = deg CC}; = n. Puisque les vecteurs de Z sont indépendants, # 
est une base de V formée de vecteurs propres. 


Montrons que la condition est nécessaire. Supposons f diagonalisable. La matrice de f dans 
une base Z de vecteurs propres est de la forme D =diag(d:,d2,...,d,), où d; EK. Comme on 
a Cf=det(D — 21,) = (d1 — z)(d2 — 2)---(d, — 2), toutes les racines de C'; sont dans K, donc 
sont des valeurs propres. Comme dans le préliminaire, appelons À:,...,A4 les différentes va- 
leurs propres. Dans la base , regroupons les vecteurs propres relatifs à À; et appelons ; la 
partie obtenue. En notant n; le nombre d'éléments de ;, on a donc n1+n2+---+nx =n, le 
nombre d'éléments de Z. Les vecteurs de Z; sont indépendants et sont propres pour À;, donc 
n; < dim V(X). Puisqu'on a dimV(A;) < m(A;) d'après une précédente proposition, il vient 
n=n+no +... +ng <M(A) +m(h) +. +m(lx) =n 


ce qui implique n; = m(x;) pour tout à. Il s'ensuit dim V(A;) = m(À). ü 


Corollaire. Si f possède n valeurs valeurs propres distinctes, alors f est diagonalisable. 


Démonstration. L'hypothèse signifie que le polynôme caractéristique a n racines distinctes 
appartenant à K, donc ces racines sont simples : pour toute valeur propre À, on a m{À) = 1, 
donc aussi dim V (À) < 1. Comme un sous-espace propre n’est pas nul, on en déduit que V(A) 
est de dimension 1. D’après le critère de diagonalisation, f est diagonalisable. î 


a 2 
Le polynôme caractéristique de M est 


Exemple. Soient a€R, M = [4 à et f:R?— R? la transformation X — MX. 


1—-z a 
—a 2—2 
de discriminant À = 9 — 4(2 + a?) = 1 — 4a? = (1 — 2a)(1 + 2a). Si Ja] > 1/2, le dis- 
criminant est négatif, les racines de Cy ne sont pas réelles, donc f n'est pas 
diagonalisable. Supposons |a| < 1/2. 


Cu = =(1-2)2-2)+a = -32+2+0%, 


Premier cas : |a| < 1/2. Le discriminant est positif, le polynôme caractéristique 
a deux racines réelles distinctes, donc il y a deux valeurs propres distinctes 
À=(1/2)(3+ V1 — 4a?) et = (1/2)(3 — V1 — 4a?) : la transformation f est donc 
diagonalisable. 

Un vecteur propre pour la valeur propre À est une solution du système d’équa- 
tions (M — Àl)X = 0. Ce système est de rang 1 car son déterminant est nul : il 
suffit donc de résoudre une seule équation du système pour trouver X. En posant 


X — PE il vient 
max =0e [TX TE [] ee Ge + ay = 0 


et le vecteur U; — | oi) est propre pour la valeur propre À. De même, le vecteur 


U2= | 22 | est propre pour y. Dans la base (U1,U:), la matrice de f est diag(A.,u). 


178 - DIAGONALISATION 


© Dunod -— La photocopie non autorisée est un délit. 


Deuxième cas : a — 1/2. Le discriminant À est nul et le polynôme 
Cu=# =3e1(6/9) = (6-32) 


a une racine double 3/2. Il n’y a qu'une valeur propre À = 3/2, de multiplicité 2. 


Les vecteurs propres sont les solutions non nulles de l'équation 


(M-(3/2)L)X=0 ee. | H]=f]e-x+y-0e [f]=[1], où ter. 


L'ensemble des solutions, c’est-à-dire le sous-espace propre V(3/2), est de dimen- 
sion 1, engendré par le vecteur propre Fil . D'après le critère de diagonalisation, 
f n'est pas diagonalisable. 

Troisième cas : a — —1/2.La matrice est la transposée de la précédente, donc le 
polynôme caractéristique est le même. Le sous-espace propre V(3/2) est encore 
de dimension 1, engendré par le vecteur propre El Comme ci-dessus, on en 


déduit que f n’est pas diagonalisable. 


Trigonalisation 


Comme on vient de le voir, une transformation linéaire n’est pas toujours diagona- 
lisable, même si les racines du polynôme caractéristique appartiennent toutes à K. 


Dans ce paragraphe, V est un K-espace vectoriel de dimension n. 


Un exemple. Soit f une transformation de V. Supposons que, dans une certaine 
base, la matrice M de f est triangulaire à coefficients diagonaux tous égaux : 


a 
Oa  * 
M = |. , où a€ K. 


ii à 
Le polynôme caractéristique de f est (a — z)”, la seule racine est a, de multiplicité 
n, donc a est la seule valeur propre de f. 
D'après le critère, f est diagonalisable si et seulement si dim V(a) — n, c'est-à-dire si 
et seulement si V(a) = V. Cette condition signifie que pour tout vecteur u€E V,ona 
f(u)=au, autrement dit f=aidy (ou encore, si a0, f est l’homothétie de rapport a). 
Nous avons ainsi montré que f n’est diagonalisable que si c'est la transformation 
ut au, c'est-à-dire si M est la matrice diagonale al,. 
Étudions plus précisément le type de transformation linéaire présenté dans cet 


exemple. Nous continuons à utiliser les notations du paragraphe précédent. 
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Cas où f a pour seule valeur propre 0 
Posons No = {0}, Ni = Ker f, N: = Ker(f o f) et en général 


Nx = Ker(f") pour tout entier k > 1, 


où f? est la transformation fo f et ff = fofo...of. 
a —/ 
k fois 
Les N% sont des noyaux de transformations linéaires de V, donc des sous-espaces 


vectoriels de V. Voici des propriétés de ces sous-espaces. 


On a Kerf=V(O)=MCMC... CWCNnC... CN = V. 


ü] Si k > 1, alors pour tout vecteur u € N4, on a f(u) € Nx-1. 


Démonstration. Par définition, N; — Ker f — Ker(f —0idy) est le sous-espace propre V(0) 
pour la valeur propre 0. On a supposé que 0 est la seule valeur propre de f, donc le polynôme 
caractéristique de f est C'} = (—1)"z2". D'après le théorème de Cayley-Hamilton (page 152), 
on en déduit que pour tout vecteur u € V, on a 0=C;(fj(u) =(—-1)"f"{(u), donc f"(u) = 0. 
Ainsi tout vecteur de V appartient à N,,, autrement dit N,, = V. 

Montrons que les sous-espaces N; sont emboîtés. Soient k > 0 et u € Nx. On a fft1= fo ff 
et f*tl(u) = f(fF(u)) = f(0) = 0, car f(u) = 0. Tout vecteur u de N4 appartient donc au 
noyau de fF+1 qui est N,:1. Cela démontre l'inclusion Ny C Nyz1. 

Montrons la dernière propriété. Soit k>1 et ue N4.Ona f*-lof=f", donc f*-1(f{(u))=f"(u) ; 
puisque f*(u)=0, il vient f*-1(f(u)) =0, autrement dit le vecteur f(u) appartient à N;_:1.8 


Construction d'une base adaptée aux N; 

Construisons une base de V dont les premiers vecteurs sont dans Ker f = N;, les 
suivants dans ], etc, les derniers dans N,, — V. Nous dirons qu'une telle base de 
V est adaptée aux sous-espaces emboîtés N,. 


Pour cela, on choisit une base de V(0) = Ker j ; si l’on a dim(Ker f) < dim N,, on 
complète en une base de N, grâce au théorème de la base incomplète ; ensuite, 
si dim NV; < dim N3, on complète en une base de M3, et l’on continue ainsi jusqu’à 


obtenir une base de N,, = V. 


Soit (u1,Uu2,...,un) une base de V adaptée aux noyaux N,. Si le sous-espace propre 
V(0) est de dimension d, alors w1,...,u4a forment une base de V(0) et f(u;) = 0 
pour 1<i<d. 

Soit w, un vecteur de la base tel que p > d. Il y a un plus petit indice k tel que 
un € Nx. Par construction d’une base adaptée, les vecteurs de N;_1 sont combinai- 
son linéaire de vecteurs u; tels que à < p. Or nous savons (propriété (ii) que f(u,) 


appartient à N4_1, donc f (up) est combinaison linéaire de u1,...,up_1. 
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Il s'ensuit que la matrice T de f dans la base (ui, u2,...,u,) est triangulaire 


supérieure, de la forme 


0:..0...0 
Les d premières colonnes sont nulles et les coefficients diagonaux sont tous égaux à 
0. Puisqu’on a Ker(f”) = N, = V, la transformation f” est nulle, donc T° — 0. 


Cas où f a une seule valeur propre À 


Posons g= f — \idy. Si f a pour matrice M dans une base de V, alors pour tout sca- 
laire {€ K, la transformation g—tidy = f —-(1\+t)idy a pour matrice M—(A\+t)1,. 
Puisque À est la seule valeur propre de f, cette matrice est inversible sauf pour 
t — 0 : la seule valeur propre de g est donc 0. D'après l’étude précédente, il existe 
une base de V dans laquelle g a pour matrice 7. Comme on a f=g+Aidy, la 
matrice de f dans cette base est T'+ XI, de la forme 


ÀT4 * 
T(À) = À * 


EE 


Cette matrice est triangulaire supérieure à coefficients diagonaux tous égaux à À. 


Cas général 
Supposons que le polynôme caractéristique de f a toutes ses racines dans K et 


décomposons-le en produit de facteurs 
C; — (M ” 2)" 0) (> L 7)" 0) Des (e … 2) 0%) 


où les À; sont les différentes valeurs propres. 


On démontre que si #,; est une base de Ker [( f—-x idy )%)] , alors la réunion des 
, est une base de V. La matrice de f dans cette base est constituée de k matrices 
carrées de taille m(A),...,m(AZ) placées en diagonale. En choisissant pour Z; une 


base adaptée aux noyaux 
Ker(f — Xidy) € Ker[(f - À idy)*] € --: € Ker LUS - Xidy}O|, 


ces matrices seront de la forme T(X;). Énonçons ce résultat que nous admettons. 
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Proposition. Si le polynôme caractéristique de f a toutes ses racines À1,...,\x dans K, 
il existe une base de V dans laquelle la matrice de f a une forme « triangulaire par blocs » 


T' 


D] 0 


diag(T1,75,...,T%) = 


0 


Tr 


où T; = T(X;) est une matrice carrée triangulaire supérieure de taille m(x;) dont les 
coefficients diagonaux sont tous égaux à À. 


La matrice ci-dessus est triangulaire. En conséquence, la proposition affirme que si 
les racines du polynôme caractéristique de f sont toutes dans K, il y a une base dans 
laquelle la matrice de f est triangulaire, les coefficients diagonaux étant constitués 
des valeurs propres répétées autant de fois que leur multiplicité. 


Remarque 
On peut toujours trigonaliser une matrice à coefficients réels avec des valeurs propres 
et des vecteurs propres complexes. 


5. Applications 
5.1 Calcul des puissances d'une matrice 


Pour étudier les itérés d’une transformation linéaire, on a souvent besoin de calculer 
explicitement la puissance p-ième d’une matrice carrée. Voici les principaux exemples 
où l’on peut effectuer ce calcul de façon assez simple. 


La matrice est diagonale 
Si D = diag(t1,t2,...,tn), alors DP = diag(t},t},...,t?) pour tout entier p > 1. 


La matrice est triangulaire et les coefficients diagonaux sont tous nuls 
(] 
Si la matrice est triangulaire supérieure de taille n, elle est de la forme T'— INT k 
0 


On a TE — 0 et pour tout à —2,...,n, la i-ème colonne TE; est combinaison 
linéaire de E1,E2,...,E;_1. Aïnsi, T'E2 est colinéaire à E1 et plus généralement 
Ti-TE, est colinéaire à E1, donc TE; = 0. A fortiori, on a TE; — 0 et comme cela 
est vrai quel que soit 4, il vient T° — 0. Par conséquent, on a T7 —=0 si pZzn, et 
les seules puissances à calculer sont Ted 


Une matrice carrée non nulle dont une puissance est nulle s'appelle une matrice nil- 
potente. Une matrice triangulaire n'ayant que des zéros sur la diagonale est nilpotente. 
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La matrice est triangulaire à coefficients diagonaux tous égaux 
À 
Il s'agit par exemple d’une matrice T — AN .Ona T=\,+N, où N est trian- 
À 


gulaire supérieure à coefficients diagonaux tous nuls. D'après ce qu’on vient de voir, 
on a NP =0 si p>n. Pour calculer T?, utilisons la formule du binôme de Newton, ce 
qui est licite car la matrice À], commute avec n'importe quelle matrice de 4, (K) : 
P 
k 
Dans cette égalité, les seuls termes éventuellement non nuls sont relatifs aux puissances 
de N inférieures à n : quel que soit p, il y a donc au plus n termes non nuls. 


G&)  TP=(U+NP = NI, + (haine f Jar ++ nr 


La matrice est triangulaire par blocs 

La forme est T'— diag(Ti,72,...,1%), où les matrices T; sont triangulaires et occu- 
pent des blocs de lignes et de colonnes disjoints les uns des autres, comme dans la 
proposition page 182. D'après la règle du produit matriciel, on a alors 


TP = diag(1Ÿ,T},...,T}) pour tout entier p > 1. 


Méthode de calcul des puissances 


On veut calculer les puissances d’une matrice A. Supposons qu’on dispose d’une ma- 
trice inversible P et qu’on sache calculer les puissances de la matrice B=P 'AP.En 
multipliant cette égalité à gauche par P et à droite par P°!, il vient A= PBP° 1. Par 
suite, A = PBP-PBP | = PB?P let plus généralement 4? = PB? P 1 pour tout 
entier p>1. Connaissant B?, on en déduit A? en calculant un produit de trois matrices. 


Pour calculer les puissances de À, on peut chercher une base # de K°' dans laquelle la 
matrice de la transformation X + AX est diagonale ou à défaut triangulaire par blocs. 


En prenant pour P la matrice de passage de la base canonique à la base 2, la ma- 
trice de X+ AX dans la base Z est B=— P-'AP, d'après la formule de changement 
de base. On aura donc 4? = PBPP 1 pour tout entier p > 1. 


Exemple : suite vérifiant une relation de récurrence linéaire. Soient a et 
b des nombres de K et soit (u,) une suite telle que u,:2 = au,;1 + bu, pour tout 
entier p > 0. 

Posons Vy = Up+1. On à Up41 = Up+2 = Gp + buy, donc 


EMPIRE 
Up+1 EH bu» + aVp ss b à Up 
gant au %=[5] à = (1 


On en déduit X, — AP X9. Pour calculer les nombres w,, il suffit donc d’expliciter 
la matrice A? et de se donner les valeurs initiales up et u1 = Vo. 


ou encore 
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Faisons ce calcul pour a = 6 et b— —9. 

—2z 1 
—9 6—2 
(z— 3)7. La seule valeur propre est 3, racine double du polynôme caractéristique. 
Puisque A n'est pas la matrice 31, on en déduit que À n’est pas diagonalisable 
(exemple page 179). Pour trouver un vecteur propre, on résout le système linéaire : 


Trigonalisation de A. Le polynôme caractéristique de A est =2?-62+9— 


(A=SL)X =04 { 
donc U; — El est vecteur propre. Complétons ce vecteur en une base de R? en 


posant Us = [2] On a (A — 3L)Uo — al = U;, donc AU, = U; + 3U:. Puisque 


AU; = 3U;, la matrice de X + AX dans la base (U1,U2) est T — é ie La ma- 


trice de passage de la base canonique à la base (T1, U2) a pour colonnes Ui, U, 
c'est donc la matrice P — Ê ik d'inverse P 71 = Le ‘ . D'après la formule du 
changement de base, on a l'égalité matricielle T = PAP, ou encore A= PTP À. 
Calcul des puissances de AÀ.On a T = 31: + N, où la matrice N — Lo 1 vérifie 
N°? = 0. Pour tout entier p > 1, il vient donc 
TP = (31 + N}° = 3 L + p3P-1N = 1 
Puisque 4? — PTPP !, on obtient finalement 


ap = [1 . 3 p3P-! | 10]- (—p)3 pr! 
311|0, SJIEYT pt (1+p)#] 


Étude de la suite (u,). Revenons à la suite (u,) : puisque el — AP 2 | , il vient 
P 
up = (1— p)#Puo + p377 lui pour tout entier p > 1. 


+ Up 
- Le quotient —— 


1- — Sat à 

= ü1 +3 TA a pour limite u, — 3u, : on en déduit que si 
D 

uw £ 3uo, alors uw, est équivalent à (ui — 3uo)p3P7 À quand p tend vers l'infini. 

= Si u1 —<3u0, le vecteur initial X6 = el est colinéaire au vecteur propre U;, donc 


A X5=3 X9 et uy = 3 u0 (ce qui se vérifie aussi sur l'expression générale de u,). 


Nous présenterons dans le paragraphe suivant d’autres exemples de calculs d’une 
puissance de matrice. 


5.2 Étude d'itérations linéaires 


Soit À une matrice carrée de taille n. Étant donné un vecteur X, € K”, les itérés 
de X9 par la transformation X + AX sont les vecteurs X1 = AX9, X2 = AX = 
KG kr = AR 1 = A Xe 
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Dans le cas particulier où X, est un vecteur propre pour la valeur propre À, on a 
simplement X1 = ÀXo, Xo = XAX9 = X°X0,..., X, = MP X0. Si [A] < 1, alors X tend 
vers 0 quand p tend vers l'infini et les X, tendent vers le vecteur nul. 

Voici un résultat général. 


Proposition. Soit AE .M,(K). Si toutes les racines du polynôme caractéristique de A 
sont de module strictement inférieur à 1, alors AP tend vers O quand p tend vers l'infini. 


Démonstration. Supposons d’abord que A= \+N, où N est triangulaire avec coefficients 
diagonaux tous nuls. Le nombre À est donc valeur propre de A. Puisque N° — 0, la formule 
(+) page 183 s'écrit pour tout p > n : 


A = I, + (1) MN ose Q MEN is ( * 1) xP-nHINN-1, 
L Du 


Si À=0, alors 4 =0 pour p>n, donc A4? tend vers 0. Supposons À £ 0. On a (?) = 
nr 1)--.(p—k+1)<pf, donc (2) Ah | <|AÏ-FpÉ|AIP. Quand p tend vers l'infini, on sait 


que, pour k fixé, pl|A[P tend vers 0, car on a supposé |A] < 1 : les coefficients de la matrice 


(P)AP-ENF ont donc pour limite 0 quand p tend vers l'infini. Pour tout p > n, AP est une 
somme de n matrices qui tendent vers 0, donc 4? tend vers 0 quand p tend vers l'infini. 
Supposons maintenant que À est constituée de blocs diagonaux À; + N; de la forme qu’on 
vient de traiter. Les À; sont des valeurs propres et AP s'obtient en élevant chaque bloc à la 
puissance p. Puisque dans AP, chaque bloc diagonal tend vers 0 quand p tend vers l'infini, 
il en va de même de 4. 

Dans le cas général, trigonalisons À sur C : on obtient une matrice P € H,,(C) et une ma- 
trice T triangulaire par blocs telles que 4? = PTPP-! quel que soit l’entier p > 1. On vient 
de montrer que T? tend vers O0 quand p tend vers l'infini. Chaque coefficient du produit 
PTP PT est une combinaison linéaire, à coefficients indépendants de p, des coefficients de 
T? : les coefficients de A? tendent donc vers Ü quand p tend vers l'infini. î 


Corollaire. Soient AE M, (K) et B un vecteur-colonne de K”. 


— Si 1 n'est pas racine du polynôme caractéristique de À, la transformation X -— AX +B 
a un unique point fixe W = (I, — A) !B. 

— Supposons que le polynôme caractéristique de À a toutes ses racines de module strictement 
inférieur à 1. Alors toute suite (X,) telle que X,41 = AX, + B a pour limite le point 
fixe W tel que W = AW + B. 


Démonstration. Un vecteur X €K” est point fixe si et seulement si AX+B=X, ce qui s'écrit 
(1h — A)X = B. Si 1 n’est pas racine du polynôme caractéristique de À, la matrice ,, — À est 
inversible, donc l'équation a pour seule solution X = (1, — A)! B. Supposons que le polynôme 
caractéristique de À a toutes ses racines de module strictement inférieur à 1. En particulier, 1 
n’est pas racine, donc il existe un unique point fixe W, tel que AW + B = W. Soit (X,) une 
suite telle que X,41 = AX, + B. On a X,41 — W =(AX, +B)-(AW +B)=A(X, -W), 
donc X, —- W = AP(X5 —W) pour tout entier p > 1. Quand p tend vers l'infini, A? tend vers 
0 d’après la proposition précédente, donc X, tend vers W. ü 


CHAPITRE 6 - ESPACES VECTORIELS ET APPLICATIONS LINÉAIRES - 185 


Itération dans R°? 
Soit À € MR) et soit f : R? — R? la transformation X + AX. 


Exemple 1. Supposons que le polynôme caractéristique de A a deux racines 
complexes distinctes. Ce polynôme étant à coefficients réels, les deux racines sont 
conjuguées : notons-les À = a+ bi et À = a—bi, où b 0. 


Soit U € C? un vecteur propre pour la valeur propre À. Puisque À est à coefficients 


réels, on a AU = AU = AU = AU, donc Ü est vecteur propre pour À. 
Posons ÜU = U;, +iU:, où U, et U> sont des vecteurs à coefficients réels. 


Les vecteurs U; et U2 forment une base de R?. 


Onaeneffet U—=U—iU», 201 =U+U et 2iU>=U —Ù ; si x et y sont des nombres réels 


tels que x, +yU2=0, alors 0=27U, +2yU2=m(U+U)-yi(U-U)=(xr-yi)U+(x+yi)U. 
Puisque À £ X, les vecteurs propres U et U sont indépendants dans C?, donc x+yi=0 


et z=y=t. 


Pour étudier les itérés d’un vecteur par f, utilisons les coordonnées dans la base 

(U1,Uo). On a AU; +i AU = AU = ÀAU — (a+bi)(U; +iU:) =aU; . bU2 +i(oU: +aU), 

d’où en séparant parties réelle et imaginaire AU; = aU; — bU» et AU; = bU; + al. 
a Ji 

—b a]° 

Il faut maintenant calculer BP. Posons r = Va? + b?; puisque b£Z0,onar>0et 

il existe un nombre 0 € [0,27] tel que a = rcosô et b=rsin0. Il vient B =rM(6), 


La matrice de f dans la base (U1,U>) est donc B — | 


avec M(0) = Le | , et par suite (exemple page 170) 


p _ pl Cospô sin pô 
Er ee . | 


Notons («,/B) les coordonnées d’un vecteur quelconque dans la base (U/;,U2) : on a 
ainsi | = P | 3 | , où la matrice de passage P a pour colonnes U;,U2. Donnons-nous 
un vecteur initial Xo = aoÙ1 + Bol et notons X, = œÙ: + BU les itérés de X5 


par la transformation X + AX. Pour tout entier p>1l,ona É | — BP [a]. 
P 


‘+ Œ| al _ | 
Si l’on pose H =B|$] = a , alors on a 


(+) a? + pe _ r?(o + 6?) 


Pour tout nombre réel k > 0, la courbe ÆEy, formée des points (x,y) € R? dont les 
coordonnées à, vérifient a? + (8 = k? est une ellipse centrée à l’origine. D’après 
(x), tout point X € F% est transformé en un point AX € E,;x. 
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Sur la figure ci-dessous, nous avons représenté les axes de coordonnées « et 6, 
dirigés par U; et Un), et nous avons supposé r < 1. 


Les itérés de X, sont sur une spirale qui tend vers l’origine si 
r <1, qui s’en écarte si r > 1. Noter que l’angle des vecteurs X,AX 
n’est pas 0 en général. 

Nous avons déjà rencontré une trajectoire de cette forme page 17, 
dans un exemple d’itération. 


Exemple 2. Supposons que le polynôme caractéristique de A a deux racines réelles 

À, Li. 

Il y a une base (U,V) de vecteurs propres associés et tout point X € R? a des 

coordonnées «,6 dans cette base : si X = aU + BV, alors AX a pour coordonnées 

| : : | | al L | dB | dans la base (U,V') et les itérés d’un point initial Xo—aoU+/V ont 

pour coordonnées É: | = Ë | : [3] = PA . Pour trouver une équation de la 
p 


À ee a ; 
courbe où se trouvent ces points, éliminons p entre les égalités { B. uP % . Pour sim- 
p — 0 
plifier, supposons À et y strictement positifs et plaçons nous dans le cas général «00, 
BF0, À 1 et u#1. On peut tirer p de la première égalité et porter dans la seconde : 


P=% ,p=(maytm(®) ,m(Æ)=pmy= An 
ao 8 , ao Bo In In À ao 

p . , Où l'on a posé r — _ 

In À 


Bo 

Pour des valeurs @ et fo positives, les itérés 
se situent sur la courbe d’équation 5 = ka”, 
où k= Ho/af ; l'exposant r ne dépend que des 
valeurs propres. Les figures ci-contre montrent 
l'allure de la fonction puissance t + f” selon 
les valeurs du nombre r. 

Si l’on change le signe de à, alors a, change de signe, de même pour H et 3, : cela 
fournit des courbes symétriques par rapport aux axes. Les figures ci-après montrent 
le comportement des itérés selon les valeurs propres de À : les droites correspondent 


ao 
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aux directions propres et les flèches indiquent le sens de parcours. 


y À y À 


Dehduel Dexei< 
Dans le cas 0 < À < u < 1, les itérés tendent bien vers l’origine. On peut voir ces 


mêmes trajectoires d'itération page 19. 


5.3 Suite de transitions probabilistes 


Considérons un phénomène aléatoire pouvant prendre un nombre fini d'états, les 
changements d'états se faisant successivement. Numérotons les états de 1 à k, appe- 
lons X9 le numéro de l’état initial et X, le numéro de l’état après n changements. 


À la variable aléatoire X,,, associons le vecteur 


ie 
CE D : 
p(Xn = k) 


où p(X, =i) est la probabilité pour qu’on soit dans l’état à après n changements d'état. 
Faisons l'hypothèse suivante : la probabilité pour passer de l’état j à l’état à reste 
constante, c'est-à-dire ne dépend pas de n. 

Pour tous entiers i,j compris entre 1 et k, notons p;; la probabilité de transiter de 
l'état j à l'état à. On a donc pi; = p(Xu11 = i| Xh = j), probabilité conditionnelle 
pour que X,+1 = à sachant que X,, = j. 

On définit la matrice de transitions en posant M — [el où comme d’habitude le 
second indice est celui de la colonne. 


Par définition d’une probabilité conditionnelle, on a 
PX nr =) = pa P(Xn = 1) +p2P(Xn =2) ++ pi p(Xn=k)= [pa pi ++ px] Z(n), 
autrement dit pour tout entier n > 1, on a Z(n +1) = MZ(n). 


Si l'état initial porte le numéro X0 = j, alors Z(n) = M"E;, 
où E; est le j-ème vecteur canonique de R*. 
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Exemple. Dans une population exposée à une maladie transmissible non mortelle, 
distinguons trois catégories : les malades, les individus qui sont infectés mais ne 
développent pas la maladie et ceux qui restent sains. Une étude statistique montre que 


- sur 100 individus sains, 30 tombent malades la semaine suivante, 20 deviennent 
simplement infectés et 50 restent sains; 

- sur 100 individus infectés, 70 développent la maladie dans la semaine; de plus, 
un individu infecté ne redevient pas sain immédiatement, faute de soins; 

- sur 100 malades, 40 restent infectés la semaine suivante et 35 sont guéris. 


Formons la matrice de transitions (les changements d'état étant hebdomadaires) : la 
première colonne correspond aux transitions depuis l’état « malade » (M), la deuxième 
depuis l’état «infecté » (1) et la troisième depuis l’état « sain » (S). 
Les coefficients de la première colonne sont donc : la probabilité p11 — 0,25 de rester 
à l’état (M), la probabilité p21 — 0,4 de passer de l’état (M) à l’état (1) et la probabilité 
pa1 = 0,35 de passer (M) à (S). 
De même, nous écrivons dans la deuxième colonne les probabilités p12, p»2 et p32 de 
passer de l’état (1) aux états (M), (D, (S), et dans la troisième colonne les probabilités 
0,25 0,70 0,30 
de transition de (S) vers (M), (D, (S). On obtient AM = | 0,40 0,30 0,20 
0,35 0 0,50 
Dans chaque colonne, la somme des coefficients vaut évidemment 1. 


Propriétés d'une matrice de transitions 
Soit M = [p;;] une matrice de transitions de taille K. 


Propriété 1. Les coefficients de M sont positifs ou nuls et dans chaque colonne, la 
somme des coefficients vaut 1. 


En effet, les coefficients de la j-ième colonne sont les différentes probabilités de 
transition depuis l’état j : leur somme est donc 1. 


Cela veut dire que si U est le vecteur-ligne dont tous les coefficients sont égaux à 1, 
on a (*U)M = !U, ou encore en transposant (*M)U = U. Ainsi 1 est valeur propre 
de ‘M, donc de M, car des matrices transposées ont même polynôme caractéristique 
(page 152). Énonçons cette propriété. 

Propriété 2. La transformation X — MX a pour valeur propre 1. 

Propriété 3. Les valeurs propres de M sont de valeur absolue inférieure ou égale à 1. 


Soit À une valeur propre de M. Puisque {M et M ont mêmes valeurs propres, À est 
valeur propre de M, donc il existe un vecteur-colonne non nul V tel que (*M1)V=AV, 
ou encore, en transposant, (*V)M = \V. Notons w1,v2,...,v4 les coordonnées de V 
et soit v, une coordonnée de plus grande valeur absolue, donc |v;| < [v,| quel que 
soit j —1,2,:.., k. Posons [wi wo -:+ wx]= (V)M. On a pour tout j 


fu] = |vip1; + vapa; +: + vepe| < [uilp1; + lv2lpa; + - ++ + uxlpe; 


< |UglP15 + ValPas + + + lualPes = lual - 
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Puisqu’on a par hypothèse w;=Av; pour tout 3, il vient [X[u,|=|Av,|=lw,|<|v|. Or v 
n’est pas nul, car V n’est pas le vecteur nul. Donc |\[<1, ce qui démontre la propriété (3). 


Étude d'une suite de transitions 

Supposons pour simplifier que 1 est valeur propre simple de M, que —1 n’est pas 
valeur propre et que M est diagonalisable. Notons V un vecteur propre de M pour 
la valeur propre 1. 


D'après ces hypothèses, la matrice de X + MX dans une base convenable de vecteurs 
propres est de la forme D=diag(1,12,...,14), avec |X;| < 1 pour tout à > 2. En appelant 
Q la matrice des vecteurs propres, on a M = QDQ"! et donc M" = QD"Q"!. Quand 
n tend vers l'infini, À? tend vers 0, donc D" tend vers À = diag(1,0,...,0) et QD" 
tend vers QA. La première colonne de QA est la première colonne de @, c'est-à-dire le 
vecteur propre V, et les autres colonnes sont nulles. Il s'ensuit que M" =QD"Q"! tend 
vers la matrice QAQ 1 =[V 0 ::: 0]Q! dont toutes les colonnes sont colinéaires à 
V. Puisque M” est une matrice de transitions, la somme des coefficients d’une colonne 
quelconque vaut 1. On en déduit : 


la limite de M” est la matrice dont toutes les colonnes sont égales à 
(1/s)V, où s la somme des coefficients de V. 


Reprenons la matrice de transitions de l'exemple précédent. 
Le polynôme caractéristique de M est (1/200)(z— 1)(2002? — 102 — 17) et les valeurs 
propres sont 1, (1/40)(1+ 137), ces deux dernières valeurs valant à peu près 0,317 


et —0,267. À partir de n —5, les deux premières décimales des coefficients de M" 
restent stables : à 107? près, on obtient 


lim (M") = 


nt +00 


0,31 0,31 0,31 

0,28 0,28 0,28 

Qu'un individu soit à l’origine malade, infecté ou sain, la probabilité pour qu’au 
bout de six semaines il soit encore malade est d'environ 0,4, la probabilité pour qu'il 
soit seulement infecté est d'environ 0,31 et la probabilité pour qu'il soit sain est d’un 
peu plus de 0,28. La colonne V de la matrice lim,,.,, M" est vecteur propre de 
M pour la valeur propre 1 : on a MV = V. Cela veut dire que la répartition 40% 
de malades, 31% d'infectés et 29% de sains reste stable au cours du temps. Ce que 
l’on a montré, c’est que quelles que soient les proportions initiales de sujets malades, 
infectés ou sains, la population évolue probablement vers cette répartition stable. 


os 0,40 va 


5.4 Itérations affines commandables 


On rencontre souvent des transformations de R” de la forme X + AX + V, où la 
matrice À € AM,(R) est constante et où V est un vecteur de R” dont on peut faire 
varier les coordonnées. 
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Supposons que les coordonnées de V dépendent linéairement de m paramètres réels 
ui 


U1,U2,..., Um : nous dirons que le vecteur U — : est le vecteur de contrôle. Notre 


Um 
hypothèse est que V dépend du vecteur de contrôle par une relation de la forme 
V = BU, où B est une matrice à n lignes et m colonnes. La transformation s'écrit 


X+H AX + BU 
et s'appelle un système linéaire contrôlé. Si l’on choisit successivement Uo,Ui,Uo,...,Uy-1 
comme vecteurs de contrôle, un vecteur initial X0 est transformé en 
X, = AXo+ BU, Xo= AX+ BU, ... , Xx = AXy_ 1 + BUz 1. 
Voici l’une des questions qui se pose à propos de la suite des vecteurs X} : 


à partir d'un vecteur initial quelconque, peut-on atteindre un vecteur 
objectif donné à l'avance en choisissant convenablement les commandes ? 


Définition 

Le système linéaire contrôlé X — AX + BU est commandable si pour tous vecteurs 
X0 et X} appartenant à R”, il existe dans R”' une suite finie de commandes 
Us, U:,...,Uz_: telle que Xy% = X}. 


Si l’on part du vecteur X5, on obtient X1 = AX6 + BUo, X2 = A2 Xo + ABUo + BU; 
et en général : 


(x) Xx = AFX0 + AT BU + AF BU; +... + ABUr-_o + BU: 
Définition 
La matrice de commandabilité est la matrice C =[A"-1B A-2B ... AB B] ob- 
tenue en juxtaposant les colonnes des n matrices 4 1B, A" ?B,..., AB, B. La 


matrice C possède n lignes et nm colonnes. 


Critère de commandabilité. Le système linéaire contrôlé X > AX + BU est com- 
mandable si et seulement si sa matrice de commandabilité est de rang n. 


Cette propriété signifie que les lignes de la matrice C’ sont indépendantes, ou que 
parmi les nm colonnes de C’, on peut en trouver n indépendantes. 

Pour démontrer le critère, nous avons besoin d’un résultat préliminaire général sur 
les matrices carrées. 


Lemme. Soit AE.M,(K). Pour tout entier k>0, la matrice AF est combinaison linéaire 
des matrices In, A, 4?,..., A1, 


Démonstration. D'après le théorème de Cayley-Hamilton (page 152), il existe des nombres 
À; tels que A+ AA +... +X, A+ X,I, = 0 : la matrice A" est donc combinaison 
linéaire de 1,,A,...,A"-1, Si une matrice A* est combinaison linéaire de 1,,A,..., A"—1, 
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disons AË = a01, + a A+, + a,_14""1, alors en multipliant par À, on obtient AF+1 = 
ao À + a A?+,...+a»_11" ; puisque A" est combinaison de 1,,A,..., A1, on en déduit 
que A*+1 est aussi combinaison linéaire de 1,,A,..., A1. Cela démontre le résultat, d’après 
le principe de récurrence. ü 


Démonstration du critère. Considérons la matrice C4, —=[AF-1B AF-2B ... AB B] à 
km colonnes. D’après le lemme, les matrices Ak-1B,...,AB,B sont combinaisons linéaires 
de A*-1B,..., AB, B. On en déduit que si k > n, les matrices C4 et C, ont même rang. 

Supposons le système commandable. Tout vecteur X € R" peut être atteint à partir du vecteur 


nul : pour un certain entier p, on a donc d’après (*) [ Uo 
us | 
X = A71BUo + A ?BU; +... + ABU,_2 + BU,_1 = C,U*, où U* = | . | . 
Uni 


Le vecteur U* possède pm coordonnées. En prenant pour X les vecteurs canoniques de 
R" et pour k le plus grand des entiers n et p correspondants, on obtient une matrice C4 
dont les colonnes engendrent R”, donc de rang n. D'après le résultat indiqué en début de 
démonstration, on en déduit que la matrice C = C,, est aussi de rang n. 

Réciproquement, supposons que la matrice de commandabilité C' est de rang n et soient 
Xo, Xf des vecteurs de R”. Le vecteur X} — A" X% est combinaison linéaire des colonnes de 
C', donc s'écrit X} — A X5 = AT BUo + A2 BU; +: + ABUn-_2 + BUn_1 pour certains 
vecteurs Uo,U:,...,Uh_1 de R°”. Si l’on prend le vecteur Xÿ comme vecteur initial, on obtient 
Xn = Xf d'après (*x). Le système est donc commandable. ü 


Exemple. Considérons un oscillateur régi par l'équation différentielle 

(e) = -wr+u, 

où comme d'habitude, à désigne la dérivée par rapport au temps et # la dérivée se- 
conde. Supposons « constant sur un intervalle de temps [fo,to + T[. Alors la fonction 


constante u/ w? est solution. Si {. est entre to et to+T, il y a une unique solution ayant, 
à cet instant {,, un état x. et une vitesse +. données : cette solution est définie par 


c(t) = (x, — u/w?) cos[w(t — #,)] + (&:/w) sin[w(t — 4,)] + u/w? 


Discrétisation de l'équation différentielle (e). Donnons-nous 9 et 0 à 
l'instant to — 0 et choisissons une durée T > 0. Servons-nous de u comme commande 
en prenant u = u, sur l'intervalle de temps [0,T{], u = u sur [T,2T|, u = ux_1 sur 
[(k—1)T, KT! : à l'instant KT, x se trouve alors dans un état x} avec une vitesse ÿ4. 
En fixant u = ux pendant l'intervalle de temps [kT, KT +T{, la solution pour 
KT <t<KT+T est 


rt) = (xx — ux/w?) cos[w(t-KkT)] + (&x/w) sin[w(t-KkT)] + ux/w?. 
L'état à l'instant & = XT+4T = (k+1)T est donc 
Tru = (tr — ur /w?) cos(wT) + (ir /w) sin(wT) + ug/w°? 
et la vitesse est donnée par 


bp = E(KT4T) = -w(xx — ux/w?)sin(wT) + x cos(wT). 
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En réunissant état et vitesse en un vecteur de R?, on obtient les égalités matricielles 


ÉA - | coswT Sd (er | : E 4 


Tk+1 —wSsinwT coswT Tk 


__|[ coswT  (1/w)sinwT Ed 2 ps | 
E cos WT | Th + (1/7) wsinwT | "% 


Posons X=[ #4], 4=| cos wT" ul et B=(1/u?)| 1 60807 |. 11 vient 


Tk —wsinwT coswT w sin WT 
(d) Xk41 = AX% + Bug 
où Up, u1,...,ux est la suite des commandes. 


Le système linéaire à contrôle numérique X — AX + Bu s'appelle le discrétisé de 
l'équation différentielle (e) à la période d'échantillonnage T.. 

Dans cet exemple, le vecteur de commande est un scalaire et la matrice B n’a qu'une 
seule colonne. Remarquons que si WT' est un multiple entier de 2T, alors B est 
nulle et la commande u n'agit pas : il est clair que, dans ce cas, le système n’est 
pas commandable. 


Étude de la commandabilité. La matrice de commandabilité C=[ AB B] pos- 
sède deux lignes et deux colonnes. On a 


2 oswT)(1-— coswT) + (sinwT)? 
APE) un : sin LT) .  . _—. 
= (coswT)B + (1/u?)(sinuT) corn) 


et d’après la linéarité du déterminant par rapport aux vecteurs-colonne, il vient 


det C = det(AB, B) = (coswT) det(B, B) + (1/w*)(sinwT) 


sinwT 1— coswT 
w(coswT-1) wsinwT 


sinwT  1—coswT 


coswT —1 sinwl , car det(B,B) = 0. 


= (1/u%)(sinuwT) 


det C'= (1/w°)(sinwT) [(sinwT)? + (1— coswT)?] = (2/w*)(sinwT)(1— coswT) 


Ce déterminant est nul si et seulement si WT = nr, où n est un entier. 

D'après le critère de commandabilité, on en déduit que le système linéaire contrôlé 
(d) est commandable si et seulement si la période d’échantillonnage T n'est pas un 
multiple entier de la demi-période x/w de l’oscillateur (e). 
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@ 1. 


@ 2. 


@ 3. 


b 
: 4x : _ [01 00 
@ 4.On considère la matrice M — 00-10 
pa rs 


a Exercices mms 


Polynômes prenant des valeurs entières sur les entiers 


a) On considère des polynômes P6,P1,...,P, tels que PF; est de degré i. Montrer 
que ces polynômes sont indépendants. 


b) Montrer que tout polynôme P de degré au plus n s'écrit de manière unique 
2(2—1 2(2—-1)::-(2-n +1 : 

P(z)=ao+a : +a9 =. ),. -+An ) » où les a; sont des nombres. 

c) On suppose que dans l'expression ci-dessus, tous les coefficients a; sont des entiers 


relatifs. Montrer que si q est un nombre entier quelconque, alors P(q) est entier. 


Calcul des sommes 12 + 27 +-.-+k1, Notons P, l’espace vectoriel des polynômes 

à coefficients réels et de degré au plus n (donc dimP,, = n +1). 

a) Montrer que si P est un polynôme de degré k, alors le polynôme P(z) — P(z—1) 
est de degré au plus k — 1. Dans la suite, on considère l'application f : P, — P, 
qui à tout polynôme P(z:) associe le polynôme P(2) — P(z—1). 

b) Montrer que l'application f est linéaire. 

c Montrer que le noyau de f est constitué des polynômes constants. En déduire que 
l'image de f est constituée des polynômes de degré au plus n — 1. 

d) Soit q un entier tel que 0 <q<n—1. Montrer qu’il existe un unique polynôme P, 
de degré q+1 tel que P,(z2) — P,(2—1)= 21 et P,(0) = 0. Calculer les polynômes 
P l: P 2) F 3* 

e) Montrer que pour tout entier k > 1, on a 19+21+...+%k1= P,(k). 


d 
a) Montrer que les vecteurs propres de À sont les solutions (x,y) non nulles de 
l'équation cx?+(d— a)xy — by? 0. En déduire que les pentes des vecteurs propres 
réels sont solutions de l'équation bt? — (d — a)t — c = 0. 


Posons À = Ë 2 où b #0. 


b) On suppose que tous les coefficients de la matrice sont des nombres positifs ou nuls. 
{ Montrer que les valeurs propres sont réelles et qu’au moins l’une d'elles est 
positive ou nulle. 

li) Montrer qu'il existe un vecteur propre de pente positive ou nulle et à coordonnées 
positives ou nulles. 
Pour une matrice carrée de taille quelconque à coefficients positifs ou nuls, il existe 
au moins un vecteur propre à coordonnées positives ou nulles, associé à la valeur 
propre de plus grand module (théorème de Perron-Frobenius). 


194 - EXERCICES 


© Dunod -— La photocopie non autorisée est un délit. 


a) Trouver deux valeurs propres réelles. Factoriser le polynôme caractéristique en 
produit de deux polynômes de degré 2. 


b) On suppose a=—s=3, p=5 et d= —1. Calculer les valeurs propres et les vecteurs 
propres de M. Montrer que M est diagonalisable. (il y a quatre valeurs propres) 


@ 5.Ces matrices sont diagonalisables : pourquoi ? (les nombres t,a,b,c,x,y,0 sont réels) 


et et—1et—-e 1 a,  b 0 l e°° 
RE | 02+x c : oh 0 à |. 
e 


0 0 et À 38 _5 0 


0 0 —2-7Y 


5 1 —2 
@ 6.Soit M = (1/2) [15 —2|. 
00 4 
a) Quelles sont les valeurs propres des matrices M et M, = M —-t13, où tER ? Pour 
quelles valeurs de t les matrices (M;)" tendent-elles vers 0 quand n tend vers 


l'infini ? 
a x 
b) Posons À — M; /2r B=|b| et U—|7y1|. Calculer la limite des itérés du vecteur 
C z 


U par la transformation X + AX + B. 


@ 7. Recherche d'un régime stationnaire. On se place dans des conditions expérimentales où 
des particules peuvent occuper cinq états e1,...,65. Les états e4 et es sont stables. Toute 
particule occupant l’état e; ou e3 bascule dans l’un des états e2, e4 ou e; de manière 
équiprobable ; de même pour une particule dans l’état e> vers les états e1, e3 ou e4. 


a) Dessiner un graphe où les sommets symbolisent les états et les arcs les changements 
d'état. Quelle est la matrice M de transition ? 


, 0 
b) Montrer que M 2— 5 , où U est une matrice carrée de taille 3 et P une 
P_||2 
matrice à deux lignes et trois colonnes. Montrer par récurrence que pour tout entier 
U. 0 Un O0 Un 
n >1,on a M? — ” ,où Un = | 0 2u» 0 F4 44). 
P, Fe u 0 Un n Un En 
Un+1— Sun, An+1— Sun Ans On+1 = un +dn, Cn+1 = Sunt Cns dn+1 = Sun +dn. 


c) Calculer uw, et sy = u1 + u2 +: + un_1. En déduire l'expression des coefficients 
Ans On Cn et dn en fonction de n. 


d) Montrer que les matrices M?" ont pour limite la matrice 


0 0 
M = 
4/7 5/7 4/7 T; 
ST ST AT | 2 
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æ 


@ 10. 


Observer que les vecteurs-colonne de M, sont des vecteurs propres de M pour 

la valeur propre 1. En déduire que l’on a lim (M?%*!1) = MM, = M, et donc 
. nt+00 

Ms = lim (MW). 


nt +00 


e) On part d’une situation initiale où toutes les particules occupent de manière équi- 
probables les états e:, e2, e3. Montrer qu'après un grand nombre de changements 
d'état, les particules occupent presque toutes les états e4 et es, dont 62% dans 
l'état e4 et 38% dans l’état es. 


Quelques règles sur les valeurs propres. Soit M1 une matrice carrée de taille n. 


a) Soient À1,...,À, les valeurs propres de M. Montrer que si a est un scalaire, 
les valeurs propres de aM sont les nombres a; et que les valeurs propres de 
M + al, sont les À; + a. 


b) Montrer que si À est valeur propre de M, alors pour tout entier positif q, A1 est va- 
leur propre de M. En déduire qu’une matrice nilpotente n’a que la valeur propre 0. 


@11 
. . . s . ” bi a22 
. Matrice presque triangulaire. Soit M une matrice carrée de la forme . 
0 ; 
bh-1 Ann 
où les coefficients bi,...,bn_1, situés juste sous la diagonale, sont tous non nuls. 


a) Montrer que le rang de M est n ou n — 1 (considérer la sous-matrice obtenue en 
supprimant la première ligne et la dernière colonne). 


b) En déduire que les sous-espaces propres de M sont de dimension 1 (appliquer 
(a) à la matrice M — XI,). 


Une suite de variables aléatoires binomiales. Une éprouvette contient trois bactéries, 
dont une de type A et deux de type B. On les laisse se reproduire en très grand 
nombre, la proportion de bactéries de chaque type restant inchangée. On prélève 
alors trois bactéries au hasard que l’on met en culture dans une autre éprouvette. On 
répète plusieurs fois ces opérations et l’on veut étudier le nombre X, de bactéries 
de type A dans l'échantillon qui a été prélevé dans la (n—1)-ième culture (la culture 
initiale porte le numéro 0). 


a) Montrer que la probabilité pour qu’on ait prélevé h bactéries de type À dans 
l’éprouvette initiale est P(X1=h) = HP 'E où À vaut 0,1,2 ou 3. 


b) Soit k l’un des entiers 0,1,2 ou 3. Montrer que la probabilité pour que Xh41 = k 
sachant que X, = h est ()(R/3)° (1 — h/3)ŸF. En déduire l'égalité 


3 
P(Xansk) = D ()(R/3) GA — h/3) FP(Xa=h) : 
h=0 
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@1 


_ 


Notons U}, le vecteur-colonne de IR‘ de coordonnées P(X,=0), P(X»=1), 

1 8/27 1/27 0 

0 4/9 2/9 0 

0 2/9 4/9 0 

0 1/27 8/27 1 

d) Soit V —[0 1 2 3]. Calculer VA. Montrer que l'espérance de X, est VU,. Mon- 
trer que cette espérance ne dépend pas de ñn et qu’en moyenne, on prélève toujours 
une seule bactérie de type A. 


P(Xn=2), P(X»=3). Montrer que l’on a Un:1 = AU, où A = 


e) Montrer que les vecteurs canoniques E1 et E4 sont vecteurs propres de A. Cal- 
culer toutes les valeurs propres de À et les vecteurs propres associés. En déduire 
que À est diagonalisable. 


f| Montrer que l’on a U,, = AU. Quel est le vecteur U, ? Calculer A”. En déduire 
que la loi de X,, est donnée par 


2_1/2\"_1/2\" 11/2\°7 2\° 
PO) = 5 5 (8) — 6 (5) + PO = 51) +(5)] 
) 3 2 \3 6 \9 ) 2 L\3 Ë 9 
1[/2\" 2\° L._.1 f2N7. À f2\* 
pou) = 5[(G) -(G) 1) Pou-n =: () +36) 
) 2 L\3 9 ) 3 2 \3 d 6 \9 
g} On note F, la proportion de bactéries de type A dans l’éprouvette numéro n. 
Montrer que F, = X,/3. En déduire les probabilités pour que F, soit égal à 0, 


à 1/3, à 2/3, à 1. Montrer qu’il y a une probabilité 1/3 pour qu'après un grand 
nombre de prélèvements, il n’y ait que des bactéries de type A dans l’éprouvette. 


. Un exemple de système contrôlé. En Biologie, de nombreux transferts de substances 


sont régis par la loi d'action de masse : par unité de temps, la quantité de sub- 
stance passant d’un compartiment tissulaire c vers un autre est proportionnelle à la 
quantité présente dans c. 

Considérons une substance qui diffuse dans trois compartiments tissulaires. En 
notant x,y,z les quantités de substance dans chaque compartiment, on suppose 


z 
que l’évolution journalière du vecteur X — E est donnée par X'— X = MX, 


—0,8 0,4 0,4 Z 
où M — 0,3 —1 0,7] (les coefficients de M déterminent les diffusions entre 
0,5 0,4 —0,9 


les trois compartiments). On mesure les quantités initiales %0,%o,zo et l’on note 
Tn 
Xn = | Yn | le vecteur-quantité au bout de n jours. 
Zn 
a) Calculer la matrice À telle que X,11 = AX,. Quels sont ses valeurs propres et 
ses vecteurs propres ? 


b) Quelle sont les limites des quantités x,,Yn,2n quand n devient grand ? 


c) On peut intervenir chaque jour sur les quantités x,y,z en effectuant des injections 
médicamenteuses : chaque injection a pour effet d'augmenter x d’une certaine 
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quantité u qu'on peut choisir, de diminuer y d'autant et d'augmenter z de ku, 
où k est un coefficient constant. 
(il Le paramètre uw sert de variable de contrôle. Montrer que ce système linéaire 


| 
—1 |. 
k 
li) Calculer la matrice de commandabilité et montrer que si k — 1, le système n’est 
pas commandable. 

(ii) Calculer les deux autres valeurs de k pour lesquelles le système n'est pas 
commandable. 

(iv) Le coefficient & vaut 0,1 et l’on a xo — 0,17, yo — 1,42, 20 — 0,88. Quelles 
quantités uo, wi, 2 faut-il utiliser pour obtenir æ3 — 1,2, y — 0,6, 23 — 0,9? 


contrôlé s'écrit X — AX + Bu, où B — 


12. Si G est un graphe de sommets {s1,82,...,s,}, sa matrice d'incidence est la matrice 
M = Îmi;] carrée de taille n définie par : mi; = 1 si les sommets 5; et s; sont 
adjacents, m;; — O sinon. 

Si k est un entier positif, un parcours de longueur k dans G est une suite de 
k sommets adjacents; notons m;;(k) le coefficient en position i-ème ligne, j-ème 
colonne dans la matrice MF. 81 


a) Quelle est la matrice d'incidence du graphe (g) ci-contre ? 83 82 


graphe (g) 
S4 
b) Pour un graphe général, montrer que ma;(2) = MM + MM + ee + MinMnj. 
En déduire que m;;(2) est le nombre de parcours de longueur 2 du sommet s; 
au sommet $;. 
c) Montrer que m;;(k) est le nombre de parcours de longueur k du sommet s; au 
sommet s; (raisonner par récurrence). 
d) Notons À la matrice d'incidence du graphe (g). 
An On On An 
(i Montrer que A” est de la forme “4 , OÙ An11—=20n et bn11—=0n+4dbn_1. 
ds 03 bn 
li) De combien de façons peut-on aller de s1 à s> en six pas? De 54 à s4 en sept 
pas? De s2 à s1 en sept pas? 
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Chapitre 7 


Espace hermitien, 
espace euclidien 


Nous allons définir dans un cadre assez général les notions de vecteurs orthogonaux et 
de distance. Rappelons que dans l’espace vectoriel R*, le produit scalaire des vecteurs 
u=(x,y,2) et u=(x/,y',2!) est défini par u-u'=xx/+yy +22! et que la norme euclidienne 
de u est le nombre Vu: u = /x? + y? + 22. Les propriétés du produit scalaire sont 
la symétrie : uw =u-u; 
— la linéarité par rapport à chaque vecteur : on a en effet 

(ui +u2)-u = uw +u uw 

(Au): u' = A(u-u') pour tout }ER 

ce qui assure, par symétrie, la linéarité par rapport au deuxième vecteur; 

la positivité : u -u > 0 si uw n’est pas le vecteur nul. 
Certaines applications se traitent de manière naturelle dans un C-espace vectoriel : 


c'est pourquoi nous formulerons les définitions dans le cadre général d’un K-espace 


vectoriel, où K désigne R ou C. 


Produit hermitien et produit scalaire 


Dans ce paragraphe, V est un K-espace vectoriel. Si z est un élément de K, Z désigne 
le conjugué de z : on a donc 2=Z7<—2€R ; rappelons que le module de z, c’est-à-dire 


la valeur absolue si z est réel, est le nombre réel positif ou nul |2| tel que |2[? = zz. 
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Définitions 
Un produit hermitien sur V est la donnée pour tous vecteurs u et uw’ appartenant 
à V, d’un nombre u-u' € K, avec les propriétés suivantes : 
i) « symétrie hermitienne » : u-u = w-u 
ii] linéarité par rapport au premier vecteur : 

(au +u)-u = ww +u.w 

(Au) :u = A(u-u/) pour tout 1E K 
ii) « semi-linéarité » par rapport au second vecteur : 

u-(u,+u;)=u-.u;+u:u, et u:(Au) = X(u:u/) pour tout ÀEK, 
formules qui résultent de (i) et {ii} 

iv) positivité : u-u est un nombre réel strictement positif si u n’est pas le vecteur nul. 
Le nombre réel (/u : u s'appelle la norme hermitienne de u et se note ||ul|. 
Si K =R, alors uw’ est un nombre réel; on dit que uw’ est un produit scalaire 
et que |u|| est la norme euclidienne. 


En faisant À — 0 dans {i) et (ïi), on obtient u : 0 — O0 : u — 0 pour tout vecteur u. 


Définitions 
Un C-espace vectoriel muni d’un produit hermitien s'appelle un espace hermitien. 
Un R-espace vectoriel muni d’un produit scalaire s'appelle un espace euclidien. 


L'espace hermitien C7. On définit un produit hermitien sur C" en posant, 


pour tous vecteurs u — (21,22,...,2n) et w —(2,,25,...,2,,) appartenant à C”, 
; _ _ _ 
UU = 22 + 222 ++ 2n2l 


Les propriétés de symétrie hermitienne et de linéarité par rapport au premier vecteur 
sont vérifiées ; de plus, le nombre 


uu= AA +28 +... +2n2 = [Al +12 +... + 12/0 


est strictement positif si les z; ne sont pas tous nuls. 
Nous dirons que C”?, muni de ce produit hermitien, est l’espace hermitien C” usuel. 


Pour des vecteurs-colonne U et U' appartenant à C”, on a l'expression matricielle 


a 
2 
U'=|# 22 +: Zn] | = (U)T, 


où U? s'obtient en conjuguant les coefficients de U’. 
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L'espace euclidien R”. Dans l’espace vectoriel R”, la même formule 


! f' ! ! Ê ! ! ! ! 
ue U = die + moto + +ant, si u = (21,%0,...,Æn) et U = (2,%5,...,%,) 
définit un produit scalaire : on dit que IR”, muni de ce produit scalaire, est l'espace 
euclidien R° usuel; la norme de u est |}u|| = (x?+23+-::+x2)1/2, 
Pour des vecteurs-colonne U et U’ de R”, le produit scalaire usuel s'écrit 
MR S rs HET re 
Ona fu-uw|P= (x 21) +...+ (x, —x,,)?, donc |; —x{| <|u— w/|| pour tout i. 
— Il s'ensuit que si les vecteurs u et uw’ sont tels que |lu — w/|| <e, alors leurs co- 
ordonnées diffèrent au plus de €. La norme de uw — u’ est donc une mesure de 
l'écart entre les vecteurs w et u’. 


L'espace euclidien R° est l’espace de la géométrie euclidienne ordinaire. 


Exemples 


- Dans l’espace euclidien R?, la norme d’un vecteur (a,b) est Va? + b? : les vecteurs 
de norme 1 sont donc de la forme (cos 0, sin 4) (figure 1). 

- Dans l’espace euclidien R%, un vecteur (a,b,c) est de norme 1 si l’on a a?+b?+c?=1, 
donc a? + b? = cos? et c = sing : les vecteurs de norme 1 sont de la forme 
(cos 4 cos w, sin 0 cos w, sin), où 4 est entre —x/2 et 7/2. 


y À 


sin 4 


TA \. 


figure 1 


cos 0 


". figure 2 


Définissons maintenant la notion de vecteurs orthogonaux. 


Définition 
Soient u et v des vecteurs d’un espace hermitien ou euclidien. On dit que w et v 
sont orthogonaux si u - v = 0. 


Le vecteur nul est orthogonal à tous les vecteurs de V. 

Il n’y a que le vecteur nul qui est orthogonal à lui-même : en effet, d’après la 
positivité du produit hermitien, l'égalité u : u = 0 implique u = O. 

Si un vecteur u est orthogonal à des vecteurs vi,v2,...,ux, il est orthogonal à toute 
combinaison linéaire de vi, v2,...,u,, d’après la linéarité du produit hermitien. 
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Produits scalaires dans R? 
! 
Pour tous vecteurs À — 1] et X'— H de R?, posons 


XX! = prr + q(xy + x'y) +ryy, où p,q,r sont des nombres réels donnés. 


Cette expression est symétrique en X, X’, autrement dit X - X’ = X'. X ; de plus, 
les valeurs dépendent linéairement du couple (x,y), donc pour X’ fixé, l'application 
X+ X:X' est linéaire. Pour que X : X’ définisse un produit scalaire, il faut encore 
que l'expression X : X = px? + 2qxy +ry° ne prenne que des valeurs strictement 
positives, sauf si x — y — 0. Cela exige que ni x, ni y ne soit en facteur, donc p et 
r doivent être différents de 0. Puisqu’on a alors 


2 
2 TD — 
pr + 2qxy + ry = p|(x+ n) : ui 


X: X sera strictement positif pour tout X 0 si et seulement si p > 0 et rp—q? >0, 
c'est-à-dire si p > 0 et si le discriminant q? — rp de px? + 2qxy + ry° est négatif. 


Supposons p > 0 et q° — rp < 0. 
L'expression X - X’ est alors un produit scalaire sur R?. On a 
4 4 
pa + q(ay +2 y) +ryy = x(pr + qu) +y(qr +ry) = [x y] Ë |: m | 


donc 


La matrice À = É : est symétrique; son déterminant pr — q° est par hypothèse 

non nul, donc À est inversible. 

Norme d'un vecteur. Par définition, on a | X|| = VX : X = 4/px? + 2qxy + ry2. 
Soit M le point de coordonnées (x,y). Pour que le vecteur OM soit de norme 1, 
il faut et il suffit que M soit sur la courbe d’équation px? + 2qxy + ry? = 1 : cette 
courbe est une ellipse centrée à l’origine (page 219). 


Vecteurs orthogonaux à un vecteur non nul (a,b) donné. L'orthogonalité des 


vecteurs (x,y) et (a,b) s'exprime par 0=[x y] É | [6 | = x(pa+ qb) +y(qa+rb). 


La matrice À est inversible et le vecteur (a,b) est supposé non nul, donc le vecteur 


À [| = É . A n’est pas nul non plus. L’équation æ(pa+ qb)+y(qa+rb)=0 re- 


présente donc une droite vectorielle du plan : c’est la droite vectorielle orthogonale 
au vecteur (a,b) pour notre produit scalaire. 


Exemple. Prenons À — É (| , où p et r sont des nombres strictement positifs. La 


matrice À définit le produit scalaire X + X' = pxx! + ryy!. 
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- Les points M = (x,y) tels que | OM | = 1 sont ceux de l’ellipse d’équation 
cos 0 et y= sin 0 
VP Vr 


0 < 0 < 2r. Les axes de l’ellipse sont les axes de coordonnées. 


pr? +ry? = 1, qu'on peut paramétrer en posant x = , pour 


Soient (a,b) et (a/,b') des vecteurs non nuls. Si a et « sont différents de 0, ces 
vecteurs ont des pentes {= b/a et t’ =b'/a'. La condition pour que (a,b) et (a’,b') 
soient orthogonaux est paa! + rbb' — 0, ou encore tt = —p/r. Si a —0, la condition 
d’orthogonalité est b' — 0 : tout vecteur de l’axe des abscisses est donc orthogonal 
à tout vecteur de l’axe des ordonnées (les axes de coordonnées sont orthogonaux 
à la fois pour le produit scalaire usuel et pour le produit scalaire prx’ + qyy'). 
La figure montre l’ellipse d’équation x? + 4y? = k?, y 
où k 0. Les vecteurs vw et v’ sont orthogonaux et de 
norme k pour le produit scalaire X : X’ = xx’ + Ayy/. 


Si M est un point de l’ellipse, la direction orthogonale T— 
à OM est celle de la tangente en M à l’ellipse. M 


BY 


1.1 Calculs dans un espace hermitien 


Proposition. Soient u et v des vecteurs d'un espace hermitien V. 

à le + of? = (Jul? + 23e (u- 0) + [lo 

ü) [fu + ul? + lu — v|? = 2([u? + lv?) (ormule de la médiane). 

ü) Si u et v sont orthogonaux, alors ||u + v||? = ||u||? + ||v||? (théorème de Pythagore). 


iv) Pour tout scalaire X, on a | Aul| = Al] u||. 


Démonstration. Pour montrer la première égalité, développons |lu + v|? = (u +): (u +v) 
en utilisant la définition du produit hermitien. Il vient 


u+v)-(u+v)=u-(u+v)+v-(u+v)=u.u+u-v+v-u+v-v par linéarité 
P 
= [uk +ucv+ac+lvul? carv-u= av 


= [ul +2%e (uv) + ol? 


La seconde formule s’en déduit, car u:(—v) = —{u-:v). Si u et v sont orthogonaux, alors 
u-v=0 et la troisième formule n’est autre que (il. Enfin, on a (Au)-(Au)= \X(u-u), c'est-à-dire 
lAul? = ]|A?]ul?, d'où (iv) puisque norme et module sont des réels positifs ou nuls. [] 
Remarque 


Dans un espace euclidien, légalité (i] s'écrit simplement |[u+v|?=||u|?+2u.v+1||v|?, 
car le produit scalaire est un nombre réel. 


Interprétation géométrique 
L'égalité (ï) s'appelle la formule de la médiane car elle possède une interprétation 
simple en géométrie : 
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si À,B,C sont des points de l’espace euclidien usuel et si 1 A 
est le milieu de B,C, alors 


AB? + AC? = 2 A7? + (1/2)BC?. 
En posant u = AB et v = AC, on a en effet u + vu —=2A1, 


u—-v=CB, AB= ul, AC = {v| et d’après (il, il vient 
(2A1)? + CB? = 2(AB? + AC?). 


u+v =2AI 
— La formule {ii} généralise le théorème de Pythagore : en effet, 
si le triangle ABC’ est rectangle en À, les vecteurs BA et AC sont orthogonaux 
et puisque BÀ + AC = BC, l'égalité (iii) s'écrit BA? + AC? = BC?. 


Inégalité de Cauchy-Schwarz. Pour tous vecteurs u,v de V, on a [u-v|<{||ul|||v||. 
Si u et v sont non nuls et si on a l'égalité, alors u et v sont colinéaires. 


Démonstration. Si uv — 0, l'inégalité est vraie. Supposons u : v # 0. Soit z le nombre 
complexe tel que z{u-v)=|u:v|; ce nombre z est donc de module 1 et vérifie (zu)-v={|u:v|. 
Pour tout nombre réel {, on a 

zu + tu? = |zul? +2%e (zu : tu) + |ftv|? 


= lu} + 24%e (zu - v) + lvl? car t est réel et ||zu]| = [2[[u] = ||ul|. 


= [Ju]? + 2tju -v| + P]ul? par définition de z. 
La fonction t+ #?|v||? + 2tlu - v| + ||u]? ne prend que des valeurs positives ou nulles, donc 
le discriminant réduit |u-v|? — |ul|? ||v||? est négatif ou nul, d’où l'inégalité |u - v| < |[u|| |v||. 


Considérons le vecteur w = |v||?u — (u-v)v. On a 
lol? = Il el? — 2e (lola - Cu: v)v) + lu: vf Ilul? 
= [ol —-2%e (lvl? (a v)(u- v)) + lu: v|vl? 
= [ol ul? — 2e le: of + lu ol = fol? (allo? — lu: 0?) . 
Supposons qu’on a légalité [u-v| — [|u||||vl|. Alors il vient |w||? 0, donc w —0 et les vecteurs 


u et v sont colinéaires. = 


Propriétés de la norme. Pour tous vecteurs u et v appartenant à V et pour tout 
scalaire À€E K, on a 


il [lu] > 0 et l'équivalence (|[u]| = 0 — u = 0) 

ï] [Au] = | A|lul| 

üü) [fu + v|| < [lul| + [lvl] Gnégalité triangulaire). 

Démonstration. Nous avons déjà remarqué les propriétés (i] et (ii). Montrons l'inégalité (ii). 


On a fu+v|?=|u?+|v|?+2%e(u.v). La partie réelle d’un nombre complexe est inférieure 
ou égale au module, donc il vient 


lu +? < ul + ol + 2e ol < Tu? + roll? + 21e lvl 


d’après l'inégalité de Cauchy-Schwarz. On a ainsi {lu +v||? < (|lu|| + |[v||)}?, d’où le résultat. m 


La norme d’un vecteur uw mesure l’écart entre u et le vecteur nul; la norme du 
vecteur u — v est une distance entre uw et v. 
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1.2 Base orthonormée 


Dans un espace hermitien, les combinaisons linéaires de vecteurs deux à deux 
orthogonaux conduisent à des calculs plus simples. 


Proposition. 
— Si u,u,...,u, sont des vecteurs de V deux à deux orthogonaux, alors ||u1+u2+- - -+u, ||? 
lu] + ul? +. + lu, (Formule de Pythagore). 

— Des vecteurs non nuls et deux à deux orthogonaux sont indépendants. 

Démonstration. La première propriété se démontre par récurrence sur le nombre de vecteurs, 
en utilisant le théorème de Pythagore (page 203). Supposons que les vecteurs w1,...,u, sont 
deux à deux orthogonaux et tous non nuls, et soient x; des scalaires. Pour tout p=1,2,--.,n, 
on a par linéarité 

(œiui + Tous + + mu) u = di(ui Up) + To(uo Up) +++ + (un: Up) = Tp(Up * Up) 


car üi- Up = 0 sit £p. Si ti + vou2 +: +vnun = 0, alors x,(u, : un) = 0. On en déduit 
zp = 0, car, u, n'étant pas le vecteur nul, on a u, :u, Z 0. = 


Supposons que V est de dimension finie. 


Définition 
Une base e1,e2,...,e, de V est dite orthonormée si les vecteurs e; sont deux à 
deux orthogonaux et de norme 1. 

D'après la proposition, pour que des vecteurs €1,62,...,e, forment une base orthonor- 


mée d’un espace hermitien V de dimension n, il faut et il suffit qu’ils appartiennent à 
V, qu'ils soient deux à deux orthogonaux et tous de norme 1. 


Exemples 


— La base canonique de R” est une base orthonormée pour le produit scalaire usuel. 


Les vecteurs se ÿ | ; | | forment une base orthonormée de l’espace euclidien 


sin 4 cos 4 
R°. 
cos Ü cos @ cos ÔÜ sin — sin Ô 
Les vecteurs e; = | sin@cosé |, e2 = | sinÜsinv |, e3 = cos 0 | forment une 
sin @ — COS 0 


base orthonormée de R°. 


Remarque 

Si e est un vecteur non nul de V, le vecteur e —(1/|le|)e est de norme 1, car d’après 
les propriétés de la norme, on a |le’|| = (1/|lel)|le|| = 1. Si des vecteurs sont non nuls 
et deux à deux orthogonaux, alors en les divisant par leur norme, on obtient des 
vecteurs deux à deux orthogonaux et de norme 1. 


Proposition. Si e1,02,...,en est une base orthonormée de V, alors pour tout vecteur 
vEV,onav=(v-ei)e; +(v:e2)es +: +(v:e»)en. 
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Démonstration. Soient x1,12,...,1, les coordonnées de v dans la base e1,e2,...,e,, de 


sorte que v = T161 + T262 +: +zne,. Pour tout p—1,2,...,n,ona 
Ven = (tie1) ep + (Tao) ep ++ + (tnen) Ep = T1(e1 * Ep) + To(eo - Ep) +++ +Tn(en * Ep) 
Puisque e; :e, = 0 pour à £ p, il vient ve, = t,(ep * Ep) = Zp, Car Ep * Ep = 1. = 


Les coordonnées d’un vecteur dans une base orthonormée s’obtiennent donc sim- 
plement en calculant les produits hermitiens avec les vecteurs de la base. Il est 
également aisé de calculer le produit hermitien de deux vecteurs dont on connaît les 
coordonnées dans une base orthonormée. 


Proposition. Si des vecteurs u et w! ont pour coordonnées (x1,%2,. ..,%n) et (x,7h,...,2,) 
dans une base orthonormée de V, alors 


uw = xx, tam +. +ane, et [ul = {1 +2 +... +1x,f?. 


Démonstration. Notons e:,62,...e, la base orthonormée considérée. On a e;-u/=u’ : €; —ÿ;, 
d’après la proposition précédente. Puisque u = xie1 +--:+21,e,, on en déduit par linéarité 
la formule pour le produit hermitien u - u/. = 


Construction de bases orthonormées 
Voici un moyen d'obtenir une base orthonormée à partir d’une base quelconque de 
l’espace vectoriel V. Cette méthode s'appelle l'algorithme de Gram-Schmidt. 
Supposons par exemple V de dimension 3 et soit w,,1%,v3 une base de V. 
Étape 1. On pose € — GT ce qui est possible car le vecteur v n’est pas nul. 
Vi 

Le vecteur e; est de norme 1. 

Étape 2. Dans le plan engendré par vi,v, on considère un vecteur v = Àe; + w2 et 


l'on cherche le scalaire À pour que v soit orthogonal à e:. La 


condition s'écrit ? 
O=v'e =(Ae +w)-e v Aei vo 
— À61 € + Vo - € = À + Vo: € Car ee = 1 
Il vient À = —w2:e1 d'où u — —(u2 - e1)e1 + v. 
Puisque v. et v sont indépendants, e, et v2 le sont aussi, donc V1 €1 


v n'est pas nul. On pose alors € — 4 : ainsi e2 est de norme 1 et orthogonal à e:. 


Ilv|| 

Etape 3. On cherche ensuite un vecteur w = À1e1 + À262 + v3 orthogonal à e; et à e2 : 
0 = w-e1 = Àjes - € + A6 : €1 + V3 € = À + U3 -e car € -e, =0 et ee = 1 
0 = w- 62 — Àjes : eo + À2e2 : E9 + V3 : €9 = À9 + V3 62 Car e1 : 62 — 0 et e2-e2 = 1 
Le vecteur w — —{(u3 - e1)e1 — (u3 : €2)e2 + vs, est donc orthogonal à e1 et à e2. 
Puisque v; n’est pas combinaison linéaire de v, et w, il n’est pas non plus combi- 
naison linéaire de e; et €», donc w n’est pas nul. On pose e3 — KI : le vecteur 

vw 

e3 est de norme 1 et orthogonal à e; et €. 


Les vecteurs e1,€2,e3 forment ainsi une base orthonormée de V. 


206 - PRODUIT HERMITIEN ET PRODUIT SCALAIRE 


© Dunod -— La photocopie non autorisée est un délit. 


Cet algorithme montre que : tout espace hermitien de dimension finie possède des bases 
orthonormées. 


1.3 Un exemple d'espace hermitien 


s 


Notons V l’ensemble des fonctions continues sur [0,7] et à valeurs dans C. La 
somme de deux fonctions continues est continue, ainsi que le produit d’une fonction 
continue par un nombre, donc V est un C-espace vectoriel. 

Définissons le produit hermitien des fonctions en posant 


T 
f-g9= 7 | f()g(t) dt , pour toutes fonctions f et g appartenant à V. 
0 


Vérifions que les propriétés du produit hermitien sont bien satisfaites. 
Rappelons que pour intégrer une fonction à valeurs complexes, on intègre sa partie 


ES T 
réelle et sa partie imaginaire. Il s'ensuit que l’on a nn HO ES FA f(t) dt. 


or f OO def AOIO d= 7 |, sO D dt-7" 7, d'où le symétrie 
hermitienne. 


— D'après la linéarité de l'intégrale, on a (Af)-9=À(f-9) et (fi+f2)-g= f1-g+f2-g. 
T 
— f-f—= Li FE) FE) dt= = |f(t)l? dt est un nombre réel positif ou nul. Comme la 


fonction x+ |f(x)|? est continue et positive ou nulle sur [0,7], cette intégrale n’est 
nulle que si |f(x)| =0 pour tout x, c'est-à-dire si f est la fonction nulle (page 288). 


T 1/2 
La norme d’une fonction f € V est | f|| = (4 } FDP at) et l'inégalité de 


Cauchy-Schwarz s'écrit (en multipliant par T) 


(2) | A S(OAtO dl < <(Fuova)" (Fute) 


Une famille de vecteurs orthogonaux. Posons w — 27/T. Pour tout entier 
n € Z, définissons la fonction e, : R — € par la formule 


fe) 7748 pour tout x ER. 
Ces fonctions e, sont continues et comme on a niw(x+T)=niwx+2mni, il vient 


En(x + T) = e,(x) : les fonctions e, _ donc périodiques de période 7. 


Sin #0, il s'ensuit Le D pre) — 0. Puisque eo(x) = 1, il vient 


niv 


1 En(t)dt=0sinZ£0 et _ eo(t) dt = 1 


Remarquons les formules e,(x) = e-Pit? —e_,(x) et e,(x)eL(x) = e"iteriur = 
En+p(&). On en déduit que pour tous entiers relatifs n et p, on a 
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donc 


_ f0 sin£p 
ën 6 = {| re 


Dans l’espace V, les vecteurs e, sont deux à deux orthogonaux et de norme 1. En 
particulier, pour tout entier k > 1, les vecteurs €6,e1,...,ex sont indépendants, donc 
l’espace vectoriel V n’est pas de dimension finie. 


Le produit hermitien qu’on vient de définir joue un rôle important lorsqu'on veut 
approcher un signal périodique par des fonctions trigonométriques (voir page 549). 


1.4 Sous-espace orthogonaux et projections 


Définition 
Soit W un sous-espace vectoriel d’un espace hermitien V. On dit qu’un vecteur 
u € V est orthogonal à W s'il est orthogonal à tous les vecteurs de W. 


Le vecteur nul est toujours orthogonal à W. Si u et u’ sont des vecteurs orthogonaux à 
W,, alors on a u-w—0=4u/ -w pour tout we W, donc aussi (Au)-w—0 et (u+u')-w=0 : 
les vecteurs Àu et u +u’ sont donc orthogonaux à W. Aïnsi l’ensemble des vecteurs 
de V qui sont orthogonaux à W est un sous-espace vectoriel de V. 


Définition 
Soit W un sous-espace vectoriel de V. Le sous-espace vectoriel de V formé des 
vecteurs orthogonaux à W s'appelle l'orthogonal de W et se note W+. 


Proposition. Les sous-espaces W et W+ n'ont en commun que le vecteur nul. 


En effet, si u est dans W!, il est orthogonal à tous les vecteurs de W ; si de plus 
ue W, alors u est en particulier orthogonal à u, donc u est le vecteur nul. 


Attention : lorsque W n’est pas de dimension finie, W+ peut être réduit au vecteur 
nul (exercice 11). 


Projection sur un sous-espace de dimension finie 


Supposons que W est un sous-espace de dimension finie de V. 

Il existe donc une base orthonormée e1,e,...,e, de W. Soit ue V et soit 
u' = (u-ej)e +(u-e2)e2 +---+(u-er)e,. Le vecteur w/ appartient à W, ses coor- 
données dans la base €1,62,...,e, sont les u-e;, donc w'-e; = ue; d’après une 
proposition page 205. Il s'ensuit (u — uw’) -e; — 0 pour tout à, donc u — w” est ortho- 
gonal aux vecteurs e1,62,...,e,. Comme tout vecteur de W est combinaison linéaire 
de e1,62,...,en, le vecteur u — u’ est orthogonal à W, autrement dit u — u € W+. 
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Théorème de la projection. Soit W un sous-espace vectoriel de dimension finie de V. 


— Pour tout vecteur uEV, il existe un unique vecteur py(u)EW tel que u—pw(u)EW+. 
Le vecteur pw(u) s'appelle le projeté orthogonal de u sur W. 


> Si €e1,62,...,en est une base orthonormée de W, alors 
pw(u) = (u-ei)e: +(u:e2)e2 +---+(u:en)en 
L'application pw : V — W est linéaire et s'appelle la projection orthogonale sur W. 


Si u est un vecteur de V, alors 


1 (lu? = [lpw (ul? + lu — pw(u)|? 
jueW = pylu)=u et ueW+e py(u) =0 
ü) pour tout vecteur w € W, on a |ju — w|| > ||[u — pw(u)||. 


Démonstration. Nous avons montré ci-dessus que si €1,62,...,e, est une base orthonormée 
de W, alors en posant wi à 
pw(u) = uw = (u-ei)ei +(u-e2)es +: +(u-en)en, ü — pw(u) 
onauweWetu-uweW—. 
Montrons l’unicité du projeté orthogonal. Supposons que w/ 
est aussi un vecteur de W tel que u — u”’ € W+. Le vecteur 
(u—u”)—{(u—u/) appartient à W+ et u/ — uw” appartient 
à W; puisqu'on a (u—u”)—{(u—u') = u —u/', ce vecteur 
appartient à W et à W+, donc il est nul. D’après l'expression ci-dessus de pw(u) dans une 
base orthonormée de W, l'application u + pw(u) est linéaire. 


W pw (u) 


La propriété (i] est une application du théorème de Pythagore. Montrons (ii) : si u € W, alors 
par définition du projeté orthogonal, on a u = py(u) car 0 = u—u est dans W+ ; récipro- 
quement, si u = pw(u), alors u € W, car pw(u) EW; si ue W, alors u—0 € W+, donc 
pw(u) = 0 ; réciproquement, si py(u) = 0, alors u — pw(u) = u est dans W+. 

Soit uE V et weW. Puisque u—pw(u)EW+ et py(u)—-wEeW, ces vecteurs sont orthogonaux. 
D'après le théorème de Pythagore, il vient 


IF IF - 


uw? = fu — pu (u)) + (pue) — 0) 17 = lu — pw Cu) + pw(u) — ff > lu — pw(u) 


Voici la signification de la propriété (ii) : si l’on cherche à approcher un vecteur de ue V 
par un vecteur de W, la meilleure approximation en norme est le projeté orthogonal pw (u). 


Cas d'un espace V de dimension finie 


Proposition. Si l’espace hermitien V est de dimension finie, alors pour tout sous-espace 
vectoriel W de V, on a dimW + dim(W+) = dimV et (W+)i=Ww. 


Démonstration. La projection orthogonale py::V—W est une application linéaire d'image W 
et de noyau W+. D’après la formule de la dimension (page 172), on a donc dimW+dim(W+)= 
dimV. En appliquant cette égalité à W+, il vient dim((W+) ”) = dimV — dim(W+)=dimW. 


Tout vecteur de W est orthogonal à tout vecteur de W+, donc on a l'inclusion W € (wW+1)". 
D'après la propriété (4) page 165, on en déduit l'égalité W — (Ww1).. = 
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Hyperplans d'un espace euclidien de dimension finie. Supposons que V 
est un espace euclidien de dimension n. 


> Si h est un vecteur non nul de V, l'ensemble des vecteurs de h V 
V orthogonaux à h est un hyperplan de V, appelé hyperplan 
orthogonal à h et noté h+. 


— Pour tout hyperplan H de V, il existe un vecteur h £ 0 tel 
que H =h+. 

— Soit # une base orthonormée de V. Un sous-espace H de V est un hyperplan si et 
seulement s'il a dans 8 une équation de la forme ait: + a2t2 +: +anxty = 0, où 
les scalaires a; ne sont pas tous nuls. Dans ce cas, H est l’orthogonal du vecteur de 
coordonnées (a1,@2,...,@mn)- 


Démonstration. Si h est un vecteur non nul de V, le sous-espace engendré par À est de 
dimension 1, donc ht est de dimension n—1. Réciproquement, si H est un sous-espace de di- 
mension n—1, alors H+ est de dimension 1 : en choisissant un vecteur non nul k€ H+, on a donc 


hi= (H=) * 2H, Soient (a1,a2....,an) les coordonnées de À dans la base Z. Un vecteur x de co- 


ordonnées (%1,%2,...,1%,) est orthogonal à h si et seulement si a1%1+@22%2+---+antn=h2=0. 0 


Par le théorème de la projection, il est très simple de calculer le projeté d’un vecteur 
sur un sous-espace W dont on connaît une base orthonormée. On peut cependant 
avoir besoin d'exprimer le vecteur projeté au moyen d’une base quelconque de W. 
Avant d'établir une telle formule, démontrons un résultat préliminaire. 


Proposition. Soit À une matrice réelle à n lignes et p colonnes. Si p <n et si les 
colonnes de À sont indépendantes, alors la matrice (*A)A est carrée de taille p et inversible. 


Démonstration. Supposons que X € R? est un vecteur-colonne tel que (‘A A)X = 0. En 
multipliant à gauche par la matrice-ligne !X, il vient 0—(tXA)(AX)=t(AX)(AX)=|AX|?, 
où la norme est la norme euclidienne dans R'. On a donc AX — 0. Puisque les colonnes de 
À sont indépendantes, on en déduit X = 0. Cela montre que l'équation linéaire (A A)X = 0 


a pour seule solution X = 0 : la matrice carrée A À est donc inversible. El 

Proposition. Soient u1,u2,...,u, des vecteurs indépendants appartenant à R" et soit 

W le sous-espace vectoriel de R° engendré par uw1,u2,...,u,. Soit À la matrice ayant pour 

colonnes les coordonnées de u1,u»,...,u,. Alors pour tout vecteur-colonne X ER”, le projeté 
Pal 

orthogonal de X sur W est pw(X) = yiui +++: + Yypup, où | : | = (AA) '(A)X. 
Up 

— Cette formule donne les coordonnées du projeté orthogonal dans la base wi ,u2,...,uy 

de W. 
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— Si A1, 42,..., 4, sont les colonnes de À, les coordonnées de pw(X) dans la base 
Yi 
canonique sont y1 A1 + Y A2 +--:+ypAp = À | : 
Up 
La projection pwy : R° — R" a pour matrice A('A A) !(‘A) 
dans la base canonique de R”. 
Démonstration de la proposition. Tout vecteur X € R" se décompose en X=X’+%X", 
où X’EW et X/EW—. En notant À, les colonnes de À, les coefficients de la matrice-colonne 
(*A)X”' sont les produits scalaires (‘A;)X/=u;. X/ qui sont nuls puisque X// est orthogonal 
à tous les vecteurs de W. Il vient donc (‘A A)-t(tA)X = (tA A)-t(tA)X' + (A A)-1(tA)X" = 
(A A)! (A)X". Puisque X’/€ W, on a X’ = y1 41 + yo 49 ++, 4, = AY, où Ÿ est la 
matrice-colonne des coefficients y;. Alors (*A A)-!(*A)X' = (*A A) (FA A)Y =I,Y =Y, d'où 
le résultat puisque X’ = pw(X) par définition du projeté orthogonal. ü 


1.5 Une application : la méthode des moindres carrés 


Le problème. Supposons qu’une quantité réelle y dépende d’un paramètre x et 
qu'on dispose de n mesures yi,Y%,...,%A Correspondant à des valeurs æ1,%2,...,%» 
du paramètre; on suppose n > 2 et que les x; ne sont pas tous égaux. 

Il s'agit de trouver une relation de la forme y — ax + b qui approxime le mieux la 
relation entre les x; et les y; : précisément, on cherche à déterminer a et b pour que 
la somme des écarts [ui — (ax; + b)]” soit la plus petite possible. 
La droite d’équation y — ax + b sera celle qui s’écarte glo- 
balement le moins des points (x;,;) ; on l'appelle la droite 
de régression. 

La droite de régression permet de calculer pour tout x une 
valeur raisonnable de y : on peut ainsi faire des extrapola- ti | 
tions. 

Pour déterminer la droite de régression, nous utiliserons le théorème de projection 
dans l’espace euclidien usuel R”. 


èY 


Résolution 
Notons X le vecteur-colonne de R” de coefficients (71,%2,...,2,), Y le vecteur- 
colonne de coefficients (y1,y2,...,Un) et U le vecteur-colonne de R” dont toutes les 


coordonnées sont égales à 1. 

Pour tous nombres a et b, les y; —ax;—b sont les coordonnées du vecteur Y —aX —bU 
et la somme des (y; — ax; — b)? est égale à |Y — aX —bU||?. Quand a et b parcourent 
les nombres réels, le vecteur aX + bU parcourt le sous-espace vectoriel # de R' 
engendré par X et U. Puisque les nombres x; ne sont pas tous égaux, les vecteurs 
X et U ne sont pas colinéaires, donc ils forment une base de Ÿ/. 

D'après la propriété (ii) du théorème de projection, la norme |Y — aX — bU|| sera 
minimum si aX + bU est la projection orthogonale de Y sur #. 
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Soit A—[X U] la matrice à n lignes dont les deux colonnes sont X et U. D'après 
la proposition précédente, le projeté orthogonal de Y sur # est A(fA A) l(fAY). 
La matrice ‘A À est carrée de taille 2 : on a 

al x = Tex cl IR #0 

A Es PEU ÈS tUU| [U-X [UF]: 


Le produit scalaire X : U est la somme 5, = 21 +22 +---+x, et [U|? =n. En 
posant 5% = a? +a3+...+x? = ||[X|?, il vient donc 


—1 
t 1 __ | Sr? Sx …. 1 RO —Sz 
(A À) |. “| | ns — S fes | 
t t 
- On a AY — el Y — el _ ER où Say = LiY1 + LoY9 + + XnYn et 
Sy = Yi + Y2 +: + Un. 
: t —1ft _ 1 ND —Sx]| | Sxy| _ 1 NSxy — Sx$y 
Il vient (AA) (AY) = nai Re 822 | | Sy | _ ne LE É . 
En posant 
— Le ie er — Sa2Sy mn 


nsa = 


NSy — 5? Fi 


T 


on obtient py(Y)= A 1] = aX + bU. 


La droite de régression a donc pour équation y = ax + b. 
Par exemple, pour les données du tableau suivant, 


x: [0,310,8111116)2312.613.013,4/41145 


y 11,211,511,211911,312.412,0 2,5|2,112,0 


la droite de régression a pour équation y = 0,24x + 1,23. 


Généralisation. La méthode précédente s'applique aussi bien lorsque les données 
y: dépendent de plusieurs paramètres x,x%',.... Par exemple dans le cas de deux 
paramètres, on considère dans l’espace R° les points M; = (x;,x!,yi) et il s’agit de 
trouver un plan affine P minimisant la somme des d(M;, P)?, où d(M, P) est la 
distance du point M au plan P. 

Si H est le projeté orthogonal de M sur P et si M' est le 
projeté de M dans la direction de l’axe des y, alors on a 
MH = d(M,P)=MM'|cosal|, où a est l'écart angulaire entre 
la normale à P et l’axe des y. Il revient donc au même de 
minimiser la somme des MM. 

Si l'équation du plan P est y=ax+a'x+b, alors M} a pour 
coordonnées (x;,x!,ax;+ax,+b) et MM;=ly;-ax;-—ax!,—b]. 
On cherche donc des nombres à, a/,b rendant minimum la 
somme des (y; — ax; — ax, — b)°. 

Supposons que le nombre des données est n 3 et notons 
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X, X' et Y les vecteurs de R” de coordonnées (x;), (x!) et (w;). En appelant 
encore U le vecteur dont toutes les coordonnées sont égales à 1, la somme des 
(y: — ax; — a’! — b)? est |Y — aX — a X' — bU||? : on projette donc orthogonalement 
Y sur le sous-espace % de R” engendré par X,X',U ; en général, ces vecteurs 
sont indépendants et % est de dimension 3. Pour effectuer les calculs, on utilise la 
formule de la proposition précédente. 


Matrices unitaires, matrices hermitiennes 


Dans ce paragraphe, V est un espace hermitien de dimension n. 


Notations. Si X est un vecteur-colonne de K”, on note X le vecteur obtenu en 
conjuguant tous les coefficients de X. De même, si À est une matrice, À est la 
matrice ayant pour coefficients les conjugués des coefficients de A. 

Par définition de la transposée et du produit matriciel, on a 


t(A)=tA, AB=AB et donc, si À est inversible, AT — (A) !. 


Expression du produit hermitien dans une base orthonormée 

Si e1,e,...,e, est une base orthonormée de V et si u et u/ sont des vecteurs de 
V, alors d’après la proposition page 206, on a u-u’ = (fU)U", où U et U' sont les 
vecteurs-colonne des coordonnées de u et u’ dans cette base. 


2.1 Caractérisation matricielle d'une base orthonormée 


Donnons-nous une base orthonormée Z de V. 

Soient u1,u2,...,u, des vecteurs, U;,U:,...,U, les vecteurs-colonne de leurs coor- 
données dans la base 7 et U la matrice ayant U;,U:,...,U, pour colonnes. 
Puisque Æ est orthonormée, on a u;-u; = (U;)U; et par définition du produit 
matriciel, ce nombre est le coefficient situé en i-ème ligne et j-ème colonne dans la 
matrice ({U)U. 

Pour que les vecteurs u1,u2,...,u, forment une base orthonormée de V, il faut et 
il suffit que l’on ait (U;)U; = 0 si à £ j et ('U;)U; = 1 pour tous i et j, autrement 


dit que l’on ait ({U)U = 1,. 


Définitions 

Une matrice UE.M,(C) telle que (t{U)U=T, est dite unitaire. Une matrice UE.H, (R) 
telle que (U)U = I, est dite orthogonale. On note U(n) l’ensemble des matrices 
unitaires de #4, (C) et O(n) l'ensemble des matrices orthogonales de 4, (R). 


Proposition. Soit # une base orthonormée de V. Pour que des vecteurs ui, u2,...,Un 
de V forment une base orthonormée de V, il faut et il suffit que la matrice des coordonnées 
des u; dans la base soit unitaire si K = C, orthogonale si K =R. 
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Une matrice de .#/,(C) est unitaire si et seulement si ses colonnes forment une base 
orthonormée de C” ; une matrice de A, (R) est orthogonale si et seulement si ses 
colonnes forment une base orthonormée de R”. 


Exemples 1 0 0 
sing — | “4 ES 


Chacune des matrices ue ô —sin ‘| 7 0 sin 0 cosû —sin0 


sing cos | 
orthogonale. 0 sing cos 


Si à et 5 sont des nombres complexes, les vecteurs [3] et | | sont orthogo- 


naux dans l’espace hermitien usuel C?. Il s'ensuit que si |al? +|/3[? = 1, alors la 


matrice | 4 —b est unitaire. 
B à 


— Une matrice est orthogonale si et seulement si elle est unitaire et à coefficients réels. 


Propriétés des matrices unitaires ou orthogonales 

) Toute matrice P unitaire (ou orthogonale) est inversible et P7! est unitaire (ou orthogo- 
nale). On a P\=*P si P est unitaire, P 7! =P si P est orthogonale : pour inverser 
une matrice orthogonale, il suffit de la transposer. 

ü) Le produit de deux matrices unitaires (ou orthogonales) est unitaire (ou orthogonale). 

ï) Le déterminant d'une matrice unitaire est un nombre complexe de module 1. 
Le déterminant d'une matrice orthogonale est égal à +1. 


Démonstration. Si P est une matrice carrée, on a (*P)P =1, (P)P=I, =I, : une 
matrice P est donc unitaire si et seulement si P-1=tP; posons alors Q = P-1 : puisque 
Q=tP,onatQ=P=—Q"!, donc Q est unitaire et nous avons montré (i]. 

Si P et Q sont des matrices unitaires, alors t(PQ)PQ ='QtPPQ =tQI,Q='QQ=1I,, 
donc PQ est unitaire, d’où (ii). 

Pour toute matrice carrée P à coefficients complexes, on a det P = det P, donc det((?P) P} = 
(dettP)(det P) = (det P)(det P) = |det P|?. Si P est une matrice unitaire, il vient 1 = det1,, = 
det((*P)P) = |det P|?. Si de plus P est à coefficients réels, son déterminant est un nombre 
réel et l'égalité | det P|? = 1 implique det P = +1. = 


2.2 Isométries d'un espace euclidien de dimension finie 


Dans l’espace euclidien usuel de dimension 3, les rotations et les symétries sont des 
transformations qui conservent la distance : si f est une telle transformation, on a 
If ( AB )| = || AB || pour tous points À et B, autrement dit f ne change pas la 
norme des vecteurs. Ces transformations seront étudiées à la fin du chapitre, mais 
nous présentons maintenant leurs propriétés générales. 

Dans ce paragraphe, V est un espace euclidien de dimension n. 


Définition 
Une transformation linéaire f : V — V est une isométrie de V si ||f(u)|| = |[u|| pour 
tout vecteur u € V. 
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Propriétés d'une isométrie. Si f : V — V est une isométrie, alors 
i) pour tous vecteurs u et v de V,on a f(u)-f(v)=u-v (conservation du produit scalaire) ; 
ü) f est une bijection et f-! est une isométrie. 


Démonstration. Pour tous vecteurs u et v, on a 2{u-v) = {lu + ||? — |ul? — |}vl?. Si f est 
une isométrie, alors 


2 fu) : Cu) = 1f(u) + FE IG SON = 1 +0) AQU FOI 
= [ju + of? — fu? — lof? =2u-v. 
Si f(u)=0, alors il vient 0=|| f(u)|| ={[u||, donc u=0 : cela montre que le noyau de f est réduit 
au vecteur nul, donc la transformation linéaire f est bijective, d’après un corollaire page 173. m 


Caractérisation d'une isométrie. Pour qu'une transformation linéaire f : V — V 
soit une isométrie, il faut et il suffit que la matrice de f dans une base orthonormée soit 
une matrice orthogonale. 


Démonstration. Soit À la matrice de f dans une base orthonormée (e1,62,...,e,) de V. 
Notons À; la i-ème colonne de À : elle est formée des coordonnées de f(e;). 

Supposons que f est une isométrie. Puisque e; et e; sont orthogonaux pour à £ j, f(e;) et 
f(e;) le sont aussi, ce qui se traduit par (*A;)A; — 0; puisque e; est de norme 1, f(e;) aussi, 
donc (‘A;)A; —1. Ces relations signifient que À est une matrice orthogonale. Réciproquement, 
si À est orthogonale, alors pour tout vecteur u de coordonnées X, on a u-u—(?X)X et 
fu) - fu) = (AX)(AX) = (CC A)AX = (XX = (X)X, d'où |(u)|?= ul. 


Groupe des isométries de V. La composée de deux isométries est une isomé- 
trie, l’application identité est une isométrie et si f est une isométrie, alors f-! aussi. 
Les isométries de V forment donc un groupe de transformations. 


2.3 Diagondalisation des matrices hermitiennes 


Définition 
Une matrice M € M, (C) telle que (M = M s'appelle une matrice hermitienne. 


Une matrice à coefficients réels est hermitienne si et seulement si elle est symétrique. 
Exemple. Toute matrice hermitienne de taille 2 est de la forme 


x a—bil æ+y, æ-yl1 0 01 Gi 
ls y > R+— MECNEUr 2 


où +,y,a,b sont des nombres réels. Les matrices hermitiennes F AL h : et 
Ë e s'appellent les matrices de Pauli (exercice 5, page 156). 

Proposition. Si M E.H,(C) est une matrice hermitienne et si U est une matrice 
unitaire de taille n, alors U- MU est hermitienne. Si S € M,(R) est symétrique et si P 
est une matrice orthogonale de taille n, alors P\SP est symétrique. 
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Démonstration. On a ‘{{(U-1MU)=({U)(M)(fU-!)=U MU car ‘U=U let tM=M. 


Il vient {(U-IMU) = U-TMU, donc U-!MU est hermitienne. = 


Valeurs propres et vecteurs propres d'une matrice hermitienne 


— Les valeurs propres d'une matrice hermitienne sont des nombres réels. Des vecteurs propres 
associés à deux valeurs propres différentes sont orthogonaux dans C”. 


Pour une matrice symétrique réelle, des vecteurs propres associés à deux valeurs propres 
différentes sont orthogonaux dans R”. 


Démonstration. Soit M1 une matrice hermitienne de taille n et soient X, YŸ des vecteurs 
propres associés à des valeurs propres À et u. On a MX = \X, MY = yY et donc 


CX)CM)Y ='(MX)Y ='(AX)Y = \'(XY) = XX -Y) 
CORP = (OOMT = (OP = (OT = RAT = A(X -Y). 
Puisque M = M, on en déduit l'égalité A(X : Y) = }(X : Y), ou encore (À — H)X - Y = 0. 
Choisissons X = Y, donc À = y : il vient (u — x)||X||?, donc u = j, car ||X|| n’est pas nul. 
Supposons À £ y : alors ÀA—-n=À1-unZ#0, donc X-Y =0. = 


Voici un résultat fondamental, ainsi que son corollaire. 


Diagonalisation des matrices hermitiennes. Si M est une matrice hermitienne 
de taille n, il existe une matrice unitaire U telle que U MU est diagonale à coefficients 
réels. En particulier, M est diagonalisable sur € et les colonnes de U forment une base 
orthonormée de C"* formée de vecteurs propres pour la transformation X' -— MX. 


Démonstration. Remarquons que le résultat est évident pour une matrice de taille 1 et mon- 
trons la première affirmation par récurrence sur la taille de la matrice. Soient À une valeur propre 
de M et ee C” un vecteur propre pour À, choisi de manière que ||[e|=1. Soit W le sous-espace 
vectoriel de C’* orthogonal à e. Puisque W est de dimension n—1, il existe une base orthonor- 
mée (w2,...,w,) de W et les vecteurs e,w2,...,w, forment alors une base orthonormée de C”. 
Puisque f(e) = Xe, la transformation f : X + MX a, dans cette base, une matrice de la forme 


a= | nr 


colonne e,w2,...,w, est unitaire et d’après la formule du changement de base, on a A=Q71MQ. 
D'après la première proposition de ce paragraphe, À est une matrice hermitienne, ce qui im- 
plique à la fois que sa première ligne est [ À 0--: 0] et que M’ est hermitienne. Par hypothèse 
de récurrence, il existe donc une matrice R/ unitaire de taille n —1 telle que R/7!M'R! est dia- 


L où M' est une matrice carrée de taille n — 1. La matrice Q formée des vecteurs- 


gonale. Posons R— is F4 . La matrice R a ses vecteurs-colonne deux à deux orthogonaux et de 


norme 1, donc RÀ est unitaire et R7!— È ne | . D'après les règles du produit matriciel, il vient 
=: 1 0 À 0 1 0 À 0 À O0 
BAR = [6 pa] lo allo = lo rl = lo p1 
où D' est diagonale. On a R-tAR=R 1Q-1MQR=(QR) !M(QR). Puisque les matrices Q 
et À sont unitaires, il en va de même de leur produit U=QR. En posant D'=diag():,...,À,) 
et À = À, on a donc U MU =diag(A,...,,). Puisque U!MU est diagonale, les vecteurs- 
colonne de U sont vecteurs propres de la transformation X + MX : en effet, si U; est le i-ème 
vecteur-colonne de U, alors MU; =MUE;=U diag(A,--.,\n)Ei=U(XE:)=XUE;=xU,;. 
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s 


Si S est une matrice symétrique à coefficients réels, elle est hermitienne, donc ses 
valeurs propres sont réelles ; puisque S' est réelle, ses vecteurs propres le sont aussi, 
d’où la propriété suivante. 


Diagonalisation des matrices symétriques réelles. Si S est une matrice sy- 
métrique réelle de taille n, il existe une matrice orthogonale P telle que PSP est 
diagonale. En particulier, S est diagonalisable sur R et les colonnes de P forment une base 
orthonormée de IR" formée de vecteurs propres pour la transformation X + SX de R”. 


301 
Exemple. La matrice S — ! 3 1 est symétrique à coefficients réels, de polynôme 
112 


caractéristique det(S — 213) = (1 — 2)(3 — z)(4 — 2). 

- Le vecteur (1,1,—2) est propre pour la valeur propre 1 et de norme V6, 
- le vecteur (1,—1,0) est propre pour la valeur propre 3 et de norme V2, 
- le vecteur (1,1,1) est propre pour la valeur propre 4 et de norme V3. 


Ces vecteurs sont deux à deux orthogonaux dans R°, donc les vecteurs 


V6|-2| 2! 01. V3 |1 


forment une base orthonormée deRŸ. En mettant E;,Æ2,E3 en colonnes, on obtient 


| v6 3V22V3 100 
la matrice orthogonale P = . V6 -3V2 243 | telle que PSP = |030|. 
_24/6 0 243 0 0 4 


Dans les applications, on considère souvent les produits scalaires mutuels de vecteurs 
Mi,M,...,M, de R” en formant la matrice dont le coefficient en position (1,3) est 
le produit scalaire M; : M; = (*M;)M,;. En appelant M = [Mi ... M,] la matrice 
de taille (n,p) ayant pour colonnes M:,...,M,, on obtient ainsi la matrice carrée 
IM;:-M;] = (M)M, de taille p. Rappelons (page 210) que si M\,...,M, sont des 
vecteurs indépendants, la matrice (/M)M est inversible. 


Proposition. Soit M € M, ,(R). 

— La matrice (*M)M est symétrique et ses valeurs propres sont des nombres réels positifs 
ou nuls. 

— Supposons que M est une matrice carrée. Alors M est inversible si et seulement si les 
valeurs propres de (*M)M sont toutes strictement positives. 


Démonstration. La matrice À — (‘M)M est carrée de taille p et la transposée de A est 
CM) CM) = (MM = À, donc À est symétrique. D’après le corollaire précédent, il existe une 
matrice orthogonale P telle que P'AP=D=diag(A,)2,...,À,), où les À; son réels. Puisque 
P-1=tP, il vient D =(tP)AP = (tP)((M)MP =t(MP)(MP) et pour tout vecteur-colonne 
XER?,ona X-DX=(tX)DX = (tX){(MP)MPX = {(MPX)MPX =||MPX|? >0.En 
prenant pour X le vecteur canonique E;, on obtient DE; = À;E; et À; = Ej- DE; > 0. 
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Supposons que M est une matrice carrée. On a det À = (det'M)(det M) = (det M)?. Puisque 
det À = det D est le produit des À;, le déterminant de M est non nul si et seulement si les 
À; sont tous non nuls. = 


Construction de produits scalaires 


Soit SE M, (R). Pour tous vecteurs-colonne X et X’ appartenant à R”, le produit 
((X)SX’ du vecteur-ligne {X par le vecteur-colonne SX’ est une matrice de taille 
1, c'est-à-dire un nombre réel; une telle matrice est évidemment égale à sa transpo- 
sée, donc (#X)SX’ =t{(#X)SX’) = (!X')({S)X. Si l’on suppose en outre que S est 
symétrique, alors il vient (/X)SX’ = (tX')SX. 

Puisque le nombre (!X)SX' dépend linéairement de X et de X’, l'application 
(X,X') + (IX)SX' définira un produit scalaire sur R” si l’on a la propriété de 
positivité : (/X)SX > 0 pour tout vecteur X £ 0. 


Définition 
Une matrice S symétrique à coefficients réels est dite définie positive si (X)SX > 0 
pour tout vecteur-colonne X # 0. 


Proposition. Soit S une matrice symétrique à coefficients réels et de taille n. 


a) Si r est la plus petite valeur propre de S et R la plus grande, alors pour tout vecteur 
T1 
X= |" |ioma ryfie SUXISX<RT PE. 
Ta 
b) La matrice S est définie positive si et seulement si toutes ses valeurs propres sont 
strictement positives. Dans ce cas, (X,X')+ (tX)SX' est un produit scalaire sur R”. 


Démonstration. D'après le corollaire précédent, il existe une matrice orthogonale P et une 
matrice diagonale D=diag(\,A2....,À,) telle que P!SP=D. Soit X ER” un vecteur-colonne. 
Puisque P est inversible, il y a un vecteur Ÿ tel que X=PY et l’on a (fX)SX=({Y)(tP)SPY = 
(Y)P-1SPY car P est orthogonale. Il vient (EX)SX = ({Y)DY = Ag? + og? +. + AL y2. 
Puisqu’on a r£X\;<R pour tout à, on en déduit r D, y? <(X)SX< RS, y?. De plus, X et 
Y ont la même norme euclidienne, car la matrice P est orthogonale, donc » 17, y? = 3%, x?. 
XP <(X)SX 
pour X 0 : ainsi la matrice S est définie positive et l'expression ({X)SX’ définit un produit 


Si toutes les valeurs propres À; sont strictement positives, alors il vient 0 < r| 


scalaire sur R”. Réciproquement, s’il existe k tel que À4 < 0, alors pour le vecteur canonique 
Y = Ex, on a (*Y)DY = Axy? < 0, donc (X)SX < 0 si X = PEz. = 


Remarque 

Dans la proposition, l'inégalité de gauche est une égalité si X est un vecteur propre 
pour la plus petite valeur propre de S'; celle de droite est une égalité si X est un 
vecteur propre pour la plus grande valeur propre. 
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3 . . Le à _[pq 
Exemple 1. Cherchons à quelle condition la matrice symétrique réelle S— | q 4] est 


définie positive. Le polynôme caractéristique est Hu : nu : | =22—(p+r)z+pr —@. 


Les racines sont positives si et seulement si leur produit pr — q? et leur somme p+r 
sont positifs. Ces conditions sont équivalentes à pr — g >0etp>0, car pr >q >0 
implique que p et r sont de même signe, donc du signe de leur somme. On re- 
trouve ainsi les conditions qui ont permis, page 202, de construire un produit scalaire 


' ! 1, LT, pgqll|x 2 
ax! + q(xy + x'y) +ryy = [x y] arlly sur R°. 
Exemple 2 : étude d'une ellipse. Soit € la courbe d’équation 57? +4xy+2y°—09. 
On a 


2 . D 52]11[x 
5x° + dry + 2y° = [x y| Ê 1] : 
La matrice S = È est symétrique, son polynôme caractéristique est 2? — 72 +6— 
(z— 1)(2— 6), ses valeurs propres sont strictement positives, donc S est définie po- 
sitive. Le vecteur (1,—2) est propre pour la valeur propre 1 et le vecteur orthogonal 
(2,1) est propre pour la valeur propre 6. Les vecteurs 


forment une base orthonormée de vecteurs propres de $. Si P est la matrice ortho- 
gonale de colonnes Æ:, E», les coordonnées dans (E:,E>) d’un vecteur X € R? sont 
données par le vecteur-colonne U tel que X = PU. On a 


5x? + 4xy + 2y? = tXSX = (PU)SPU = (tU)(P)SPU, où U = CE 
= ÉONP SPU, far P= PT, 


(0); ALETET ES 


L'équation de € dans la base orthonormée (Æ1,Æ2) est donc 
simplement 

u? + Gu? — 9 (équation réduite) 
Ainsi & est une ellipse d’axes dirigés par les vecteurs E: et E2. Pour 
un point de l’ellipse, on a —-3<u<3 et —(1/2)V6< v< (1/2)V6 : 
le petit axe, dirigé par Æ2, a pour longueur 1/6 et le grand axe a 


pour longueur 6. 


3 
Exemple 3 : un ellipsoïde. Reprenons la matrice symétrique S — É 
diée page 217. Soit X un nombre positif et 6x la surface d’équation 1 


32? + 3° + 22° + 2x2 + Qyz = K?. 
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TX 


y 
z 


Pour étudier la surface, plaçons-nous dans la base orthonormée (Æ1, E2, E3) formée 
des vecteurs propres de S. Les coordonnées de X dans cette base sont données par 
le vecteur-colonne U tel que X = PU, où P est la matrice de changement de base, 
c'est-à-dire la matrice de colonnes E;, E:, E3. Il vient 


(CX)SX = (PU)SPU = (fU)(P)SPU = (U)P ISPU, car'P=P 1 


100 u 
U |. 
w 


030 
Dans la base orthonormée (E1, Es, E3), l'équation de &%x est donc simplement 


On a 3x? + 3y? +22? + 2x2 +2yz = XSX , pour tout X — 


= (0) U=u +3v+4w, où U = 


004 


u? + 3u°? + Au? = K°? (équation réduite) 

Si l’on coupe la surface par le plan des coordonnées u,v (en faisant w —0), on obtient 
l’ellipse d’équation u? +3v? = K? : elle est centrée à l’origine et ses axes sont les axes 
des coordonnées u et v. De même, l'intersection de la surface avec les autres plans de 
coordonnées sont des ellipses ayant pour axes les directions des coordonnées u, v ou 
w. Aïnsi la surface est un ellipsoïde d’axes dirigés par E1,Æ2,E3. Pour les points de 
éx qui sont sur les axes, ona —K<u<K,-K/V3<v<K/V3 et -K/2<w<K/2: 
le plus grand axe de l’ellipsoïde, porté par u, a pour longueur 2K ; l’axe porté par 
u a pour longueur 2K/V3 et le plus petit axe, porté par w, a pour longueur X. 


On doit parfois comparer deux produits scalaires : voici comment calculer la valeur 
extrême que peut prendre leur rapport. 


Proposition. Soient À et B des matrices de même taille n, symétriques définies posi- 
((X)AX 


tives. Pour tout vecteur-colonne non nul X ER", on a ———— 
EX)BX 


grande valeur propre de BA. 


< À, où À est la plus 


Démonstration. Il existe une matrice inversible C' telle que B = (tC)C' (exercice 5 page 
238). Pour tout vecteur X € R”, on a donc (X)BX = (tX)(C)CX = (fY)Y, où Y =CX. 
Puisque X — CT1Y, il vient, si Y Z£0, 

(CX)AX _ (Y)CC ACT  (Y)SY 


: = . , où S=(C-1)ACT 1. 
CX)BX CY)Y CY)Y 
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La matrice S est symétrique. On a CB! = C(C-#C-1)=tCT!, donc CB'A='CTTA et 
S = C(B-!'A)CT!. Les matrices B7!A et S ont même polynôme caractéristique (page 171), 
donc À est aussi la plus grande valeur propre de S. D'après la proposition précédente, on a 
CY)SY (FX)AX 


Cyy < À pour tout Y 0 et donc EX)BX < À pour tout X £ 0. ] 


Géométrie euclidienne 


Soit Æ un espace euclidien de dimension 3. 
Si M et M' sont des points de E, leur distance est par définition || MM ||. 


3.1 Projections et symétries 


Considérons dans Æ£ une droite affine D passant par un point À et dirigée par un 
vecteur non nul n. Soit P le plan orthogonal à n passant par À. 


Puisque le vecteur üù — ET est de norme 1, la projection orthogonale d’un vec- 
nm 
teur v sur la droite vectorielle engendrée par n est pu) = (v-u)u = El -n)n, 
nm 


d’après le théorème de la projection page 209. La projection de v sur le plan vectoriel 

orthogonal à n est ü — p(v), d’où le résultat suivant : 

Pour tout point MEE, 

le projeté de M sur D est le point H défini par 
—  AM-ñ 


le projeté de M sur P est le point K° défini par 
AK = AM — AH. 

le symétrique de M par rapport à P est le point 
M' tel que AM’ = AM —-2AH. 


Distance à un plan. Soit P un plan affine de E. 


— Si P est le plan passant par un point À et orthogonal au vecteur n 0, la distance de 
| AM -n | 
M à P'est ———. 
In | 

Si le plan P a pour équation ax+by+cz+d=0 dans un repère orthonormé de E et si M 
lat + byu + c2M + d| 
; | Vo LP RE. 
Démonstration. Avec les notations précédentes, la distance de M à P est AH = | AH || = 


a pour coordonnées (xm,ym,2m), la distance de M à P est 


LE In || = HE , d'où la première formule. Si P a pour équation ax + by + cz+d=0 
Ill Il 


dans un repère orthonormé de Æ, alors le vecteur n de coordonnées (a,b,c) est or- 
thogonal à P et si le point AE P à pour coordonnées (x4,ya,za), on a AM :n = 
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(tm — tA)a + (yu — YA)d + (2m — ZA)C = tua + ymb+z2mc+d, car d = —-ax A —bTA—crA. 


AM 1 + by + d 
La distance de M à P est donc laK] = lotus + by + czmc + d] - = 
IF Va? +b2 +02 


Symétrie par rapport à un plan. Donnons-nous un plan P par son équation 
ax +by+cz+d=0 dans un repère orthonormé de EF, où nous supposons a?+b?+c?=1 
(on dit que l'équation est «normale »). Le vecteur n de coordonnées (a, b,c) est 
orthogonal à P et de norme 1. Soit M un point de coordonnées (x,y,z). Si À est 
un point de P, le symétrique M' de M est défini par 


(+) AM' = AM - 2AH = AM - 2(AM -ñjñ 


On a aussi (voir la figure précédente) AM’ = AK — AH et AM = AK + AH, donc 
| AM'|| = || AM ||, car les vecteurs AK et AH sont orthogonaux. 


Si (p,q,r) sont les coordonnées de AM, alors d’après (x), celles de AM" sont 


b|=| —2abp + (1—2b7)q—2bcr | =| —2ab 1-2? —2bc | | q 
C —Dacp—2bcq + (1-2 )r bac be 1-26 |1T 


p a (1—2a*)p—2abq—2acr 1-2? —2ab —2ac |[p 
q | —2(ap+bq+cr) 
r 


Prenons pour À le point de coordonnées (—da,—db,—dc) qui est bien dans P, 
puisque ses coordonnées en vérifient l’équation. Les coordonnées (x,y,z) et (x',y/,2!) 
de M et M' sont reliées par la relation 


x' + da 15e Dub. ne x + da x + da 
y + db | = | -2ab 1-2 —92bc | | y+db| =S | y+ db 
z + de —Dac —2bc 1-2 z + dc 2 + de 


Cas d'un plan passant par l'origine. On a alors d = 0 et P est un plan vec- 
toriel. La symétrie orthogonale par rapport à P est une transformation linéaire s 
de Æ. Le calcul ci-dessus montre que sa matrice S dans une base orthonormée est 
symétrique. En appelant © l’origine, on a s(OM) =OM' et |OM'|=|OM|:s 
est donc une isométrie et la matrice S est aussi orthogonale. 


On a s(n) = —n et pour tout vecteur v € P, on a s(v) = : les vecteurs propres de 5 
pour la valeur propre 1 sont les vecteurs de P et le vecteur n est propre pour la valeur 


propre —1. Si l’on choisit une base quelconque (é,f) de P , la matrice de s dans la base 


- 10 0 
(e,f,n) est donc E 1 1 . Sur cette matrice, on voit que le déterminant de s est —1 : 
00 —-1 


toute matrice d’une symétrie par rapport à un plan est donc aussi de déterminant —1. 


3.2 Produit vectoriel 


Dans ce paragraphe, on se donne une base orthonormée 7 — (e1,62,e3) de E. 
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Bases orthonormées directes 

Soient u,,u,u; des vecteurs de E et U;,U»,U; leurs vecteurs-colonne de coordonnées 
dans la base . 

Les vecteurs u,u2,u3 forment une base orthonormée si et seulement si la matrice U — 
[U1 U> U3] est orthogonale. Comme une matrice orthogonale a pour déterminant 1 ou 
—1, il y a deux sortes de bases : celles pour lesquelles detU—1 et celles où detU——1. 


Définition 
Si U est une matrice orthogonale de déterminant 1, on dit que la base orthonormée 
(u1, u,u3) de E est directe (relativement à la base Z). 


Si l’on se donne deux vecteurs u1 et u2 orthogonaux et de norme 1, il y a deux 
vecteurs u3 et u} = —uz de norme 1 et orthogonaux à w1 et u2 : en effet, les vec- 
teurs orthogonaux au plan engendré par u1 et uw forment une droite. Puisqu'on 
a det(U, Us, —U3) — — det(U1, U», U3), l’une des bases orthonormée (ui, w2,u3) ou 
(u1,u2, —u3) est directe et l’autre ne l’est pas. 

Dans l’espace euclidien usuel, on dispose de la base canonique comme base de 
référence. Voici un moyen mécanique pour caractériser les bases es 
orthonormées directes (u1,u2,u3) : le vecteur u3 a le sens de dé- 


Ke 
Uu3 €e1 
placement d'un tire-bouchon posé sur l'axe dirigé par u3 et que l'on Ke . 
tourne en allant de u1 vers uw. : à V3 
Dans la figure, prenons (e1,e2,e3) comme base de référence : 

alors (u1,u2,u3) est directe et les bases (wo, ui, u3) et (vi, w2,v3) sont indirectes. 


Définition du produit vectoriel 

Rappelons que (e1,e2,e3) est une base orthonormée de E. 

Soient u = pe; +ge>+resz, w = plei +dge+r'e; et U, U! les vecteurs-colonne de R° 
correspondants. Pour tout vecteur w = ze; + ye» + zes, de vecteur-colonne W, on a 


PP / / / 
det(U,U',W)=|qg'yl=|1%}x-[Îr +177 a. 
' rr FT q q 
TT 2 
Définition. , , 
Le vecteur : 7 ei — É P, e2 + L . es s'appelle le produit vectoriel de u et uw’ 


et se note u \ u/. 


Pour les vecteurs de la base , on a ainsi : ee —e3, e»/\e3—e; et e3/\e; = €. 
Puisque la base Z est orthonormée, l'expression ci-dessus de det(U,U',W) est le 
produit scalaire des vecteurs u À uw et w. 


(u Au) -w = det(U,U',W) pour tous vecteurs u,v,w de 
coordonnées U, V,W dans une base orthonormée. 
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Propriétés du produit vectoriel. Soient u et u' des vecteurs de FE. 

i) Le produit vectoriel est antisymétrique et linéaire par rapport à chaque variable : 
uAu —=—(u Au) 
(u +u)Aw = uw Au +uAu et (Au) Au = X(u AU!) 
uA(u +u,)=uAu +u/Au, et uA (Au) = A(u Au). 

ü) Le vecteur u A w’ est orthogonal à u et à u. 

üü) u A u! est nul si et seulement si les vecteurs u et w’ sont colinéaires. 

iv) Dans toute base orthonormée directe, les coordonnées de u/\u’ sont données par la formule 

de la définition. 


v) Si u et uw’ sont orthogonaux et de norme 1, alors (u,uw',u A u/) est une base orthonormée 
directe de E. 


Démonstration. Les propriétés (i] se voient sur la définition du produit vectoriel en utili- 
sant la linéarité et l’antisymétrie des déterminants. On a (u A u')-:u = det(U,U",U) = 0, donc 
u Au’ est orthogonal à uw; de même, u A uw” est orthogonal à w’. En appliquant la formule 
uAu =-u Au à u =’, on obtient u A u = 0. On en déduit que si u et uw’ sont colinéaires, 
alors u Au’ est nul. Si u et uw’ sont indépendants, on peut trouver un vecteur w tel que u,u’,w 
soit une base de Æ (théorème de la base incomplète) ; alors (u A u’) - w = det{U,U',W) n’est 
pas nul, donc x A u' n’est pas le vecteur nul. 

Soit #1 une base orthonormée directe de Æ. La matrice de changement de base de Z 
vers #1 est une matrice P orthogonale. Avec les notations précédentes, les coordonnées de 
u,u',w dans la base 1 sont les vecteurs-colonne Ui,U,W\ tels que U = PU;, U' = PUI, 
W = PW1. On a l'égalité matricielle [U U' W]=[PU; PUS PW;]=P[U; Uj W:]. Comme 
le déterminant d’un produit de matrices est le produit des déterminants, on en déduit 
det(U,U',W) = (det P) det(Qi,Ui,W1) = det(Vi,U{,Wi), car la base 1 étant directe, le 
déterminant de P vaut 1. Si l’on prend pour w les vecteurs de Z, ces déterminants sont les 
coordonnées de u Au’ dans # et #1 respectivement : les coordonnées du vecteur u Au’ sont 
donc données par les mêmes formules, que l’on calcule dans la base 7 ou dans la base 1. 
Il reste à montrer la dernière affirmation. Supposons « et u’ orthogonaux et de norme 1. Soit 
w le vecteur tel que #’ = (u,u',w) est une base orthonormée directe. Dans cette base, les 
coordonnées de u sont (1,0,0), celles de u’ sont (0,1,0), donc celles u Au’ sont (0,0, 1) : 
c'est donc que l’on a u A uw! = w. [] 


Produit mixte. Un déterminant d'ordre 3 ne change pas si l’on permute circulaire- 
ment ses colonnes : en effet, une permutation circulaire des trois colonnes se compose 
de deux échanges et pour chaque échange, le déterminant change de signe. Puisque 
le produit scalaire (ui A u2): u est le déterminant des coordonnées de u,u9,u3 dans 
une base orthonormée, on en déduit les égalités 


(ui À u2) - u3 = (u3 A ui) : u2 = (u2 A u3) - u] 


Le nombre (u À w) : u3 s'appelle le produit mixte des vecteurs u1,U9, u3. 


Formulaire 
(1) [lu A vf? + (uv)? = ul? [ulf?. 
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(2) u A (vu A w) = (u:w)v — (u:v)w (formule du double produit vectoriel) 


Démonstration de (1). Si u et v sont colinéaires, alors u A v est nul et la première formule 
est le cas d'égalité dans l'inégalité de Cauchy-Schwarz. Supposons u et v orthogonaux et 
non nuls et posons u = |u|f1, v = [[v||f2. Puisque f1 et f2 sont orthogonaux et de norme 
1, on peut choisir un vecteur f3 tel que Z” = (f1, f2, f3) soit une base orthonormée di- 
recte de Æ. Les coordonnées de uw et v dans cette base sont (|u|,0,0) et (0, {|v,0), donc 
| [ul 0 

0 lvl 


dans ce cas. Dans le cas général de deux vecteurs u et v indépendants, il y a un nombre 
réel À tel que v’ = v — Au soit orthogonal à w (procédé de Gram-Schmidt, page 206). On a 
uAv'=uAv—uA(Au)=uAv, |v?=|v+aul2=|v/|2+X|ul? et u-v=u-v'+Xl]ul=A|u|?, donc 


u A v = fa = [lu] |lullf:. Le produit scalaire u + v étant nul, la formule (1) est vraie 


Hu Av? = Ju Av? = [ful? v’|?, car v’ est orthogonal à u 


CL 
= [ul (ol? — le?) = el? Mol? — Cu: 0). 


La première formule permet de calculer la norme d’un produit vectoriel. Si u et v 
sont des vecteurs non nuls, alors d’après cette formule, il existe un unique nombre 


réel 0 € [0, x] tel que {lu A v|| = [ul] |[v|| sin 6 et u - v = ||u|| ||v|| cos 6. 
Définition 
Le nombre 4 € [0,7] tel que [u Av||—|[ul|[[v||sin@ et u :v—||[u|||[v|| cos s'appelle 


l'écart angulaire des vecteurs u et vw. 


Exemples d'utilisation du produit vectoriel 


Aire d'un parallélogramme 

Soient À,B,C' trois points non alignés d’un plan eucli- 
dien inclus dans Æ. Construisons le parallélogramme 
(P) sur ces trois points. 


nt... 


Projetons C en H sur la droite orthogonale à AB A B 
menée par À. L’aire de (P) est le produit des longueurs AB AH. 
Puisque les vecteurs AB et AH sont orthogonaux, on a | AB |||| AH | = || AB A AH ||. 


Or AB À AH = AB A AC + AB A CH et AB A CH — 0 car C'H est colinéaire à AB. 
On en déduit que 


l'aire du parallélogramme (P) est || AB À AC ||. 


Volume d'un parallélépipède 

Soit (II) le parallélépipède construit avec le paral- 

lélogramme (P) et le point D de l’espace. 
Projetons D en K sur la droite passant par À et 
orthogonale au plan de (P); choisissons un vec- 
teur directeur % de cette droite tel que |ü|=1. À B 


Les vecteurs AB À AC et ü, tous deux orthogonaux au plan ABC, sont colinéaires : on 
a ABA AC = Ju, donc |A] = || AB À AC'|| est l’aire du parallélogramme (P). Pour avoir 
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le volume du parallélépipède, il faut multiplier l’aire du parallélogramme par la hauteur 
[A] AK = Au. AD |=|(AB À AC): AD|. 


a De 
dans une base orthonormée, on a donc 


volume de (II) — |(AB À AC) - AD) = | det( Dale sil 


U zc €t U An sont les vecteurs-colonne des coordonnées de AB, AC AD 


On en déduit une autre expression de la distance d’un point D à un plan : 


: ldet(t ss Cats 5)| 


| AB À AC || 


distance de D au plan (ABC) 


Mouvement de rotation autour d'un axe 
Si w € E est un vecteur de norme 1, on peut trouver des vecteurs u et v tels que 
(u,v,w) est une base orthonormée directe de Æ. 


En effet, si P est le plan orthogonal à w, alors pour toute base orthonormée (ü,v) de P, üA®% 


est de norme 1 et colinéaire à w, donc on a A Ü—+w. Puisque üw\ù——%/\u, il suffit de mettre 
les vecteurs dans le bon ordre pour obtenir une base orthonormée (uv) de P telle que AU=%w. 
Soit D la droite vectorielle engendrée par w. La donnée du couple (ü,v) définit un 
sens de rotation autour de D : celui qui amène w sur w. 


_ 


Pour repérer le sens d’un mouvement de rotation autour DIA 

de D, il suffit donc de se donner le vecteur w. _ 
Le vecteur rotation du mouvement est par définition le = O Vu 
vecteur ( = ww, où w > 0 est la vitesse angulaire; le P 5 M 


vecteur {? contient toutes les informations sur le mouve- 

ment : son sens indique à la fois l’axe et le sens de rotation, sa norme w donne la 
vitesse de rotation. 

Soit M un point de Æ en rotation autour de D et soit O un point de D. 


Le vecteur vitesse de M est 7 =NA OM ; 

si M est un point pesant de masse m, le moment cinétique de M en © est le 
vecteur 00 = OM A mVu. 

Choisissons un repère orthonormé (O;i, 5, k) d'origine ©, appelons (p,gq,r) les co- 

ordonnées de Q et (x, y,2) celles de OM. Les coordonnées du vecteur Va sont 

Ur = 2 —TY, Vy = TT — pz, V, = py — qzx et les coordonnées de ao sont 


MÂYVz — 20) my? + 2 )p — (may)a — (mxz}r 
mzvx — av) | = | —(mxy)p + m(x? + 22) — (myz)r 
MALUy — YUx) —(maz)p — (myz)q + m(a? + y)r 
my +22) mary —mMxZ p 
— mary Ma? +2)  —myz H 
—maxz —myz mx +) ] LT 
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Pour un solide (S) en rotation autour de l’axe fixe D, les coordonnées du moment 
cinétique au point © (dans un repère d’origine ©) sont donc données par 


Tor <l — ls D D 
lys Zyy —lyz g|=J(0)]g|, où 
A 


— Lx —Ly La r 


Les ff] +a)am ue [ff +eyam Lee [If (+1) àm 
2= ff] va : Le = Le = ff] 22 dm , De = Lu = ]f] va 


dm. étant l'élément de masse infinitésimale placé au point (x,y, 2). 


La matrice J(O) est la matrice d'inertie de (S) au point O : elle ne dépend que du 
solide (S) et du point ©. Cette matrice permet de calculer le moment cinétique en © 
d’un mouvement de rotation de autour de n'importe quel axe passant par ©. 

D'après l'égalité ci-dessus, le moment cinétique n’est dans la direction de l’axe que si le 
vecteur rotation est un vecteur propre de la matrice d'inertie. Puisque la matrice J(O) 
est symétrique, il existe une base orthonormée de vecteurs propres : un axe ayant pour 
direction l’un de ces vecteurs s'appelle un axe principal d'inertie du solide au point O. 
Les composantes du moment cinétique qui sont transverses à l’axe de rotation sont nui- 
sibles aux grandes vitesses : c’est pourquoi on essaye d’équilibrer les pièces en rotation 
rapide pour que l’axe de rotation soit un axe principal d'inertie. 

Pour étudier un mouvement de rotation, on a besoin d’un principe de mécanique, le 
«théorème du moment cinétique », valable quand le repère et le point © sont fixes : 


— 


la dérivée dre du moment cinétique par rapport au temps est égal à AMo=Î. (on Â F) ; 


moment en © des forces extérieures F appliquées au solide. 


Exemple. Considérons une plaque homogène P en forme de triangle rectangle 
en O. Choisissons un repère orthonormé (O;i, j, k) d'origine O, les vecteurs À et j 


étant portés par les petits côtés de la plaque ; le vecteur k 
est orthogonal au plan de la plaque. Calculons la matrice 51 
d'inertie de la plaque au point ©. 


En tout point de la plaque, la coordonnée z est nulle, di 
= jp, ’ : _ 2 
donc J3: = 1,: = 0 et l’on a simplement J3x — Ve y* dm, 
= 2 = 
Ey= f,sdmel.=h,+le. ._ P 
Notons a et b les longueurs des petits côtés de la plaque (RE = 
et m sa masse. Pour y fixé entre 0 et b, l’abscisse x d’un O - 


point de la plaque varie entre 0 et a — (a/b)y, donc NES 


b a—(a/b)y 3 4 3 
La = 2 . )d b” ab \ _ mab 
m | y Î dx y = m f( y=m (a à 4 12 
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3 
Pour calculer L,,, il suffit d'échanger les rôles de a et b : Lyy = D Enfin, on a 


—(a/b)y 272 


b d) 
dr = LT, — DE +1) ma (a? + 
ie 512 -ab 0 : 
La matrice d'inertie en © est donc J(O)— ÉrR —ab 20 0 . Le vecteur k 
0 O0 2a? +2 


est propre, ainsi que les vecteurs du plan xOy de pente (1/r)(r?—-1+V1-7?+71), 
où Tr — b/a : ce sont les directions, deux à deux orthogonales, des axes principaux 
d'inertie au point O. Si la plaque est isocèle (7 = 1), la bissectrice issue de O est 
axe de symétrie : c'est bien un axe principal d'inertie. 


3.3 Rotations 


Dans l’espace euclidien Æ, donnons-nous un repère orthonormé (O;ü, 3, k) d’origine 
O et une droite D passant par O, dirigée par le vecteur uni- 
taire n = ai +bj +ck (donc a +b+c—1). 

Pour tout point ME FE, notons H le projeté de M sur D et K 
le projeté de M sur le plan orthogonal à D et passant par O. 
Le vecteur ü=n1OK est orthogonal à n et à OK. Comme 
on a |ü|=|n||| OK||=|| OK |, la rotation d'axe D et 
d'angle x/2 transforme OK en &. 


Il s'ensuit que la rotation r d’axe D et d'angle Ÿ transforme OK en (cosé)OK+(sinO)v. 
En posant M’ = r(M), on a donc 


(+) OM'=OH + (cos 8) OK +(sin 8) ü 

Notons (x,y,2) les coordonnées de M dans le repère (O:i,5,k) et posons X — H ; 
— Les coordonnées de OH = (OM : ñ)n sont d 

a & ab ac| [x 

1 = Lin b? ï H = PpX. 


€ ca cb © 


(ax + by + cz) 


Les coordonnées de OK = OM — OH sont 


x 
y 
z 


Puisque OH est colinéaire à n,onan/ OH = 0, donc v—=n/A OK=nñAOM 
et les coordonnées de v sont 


bz — cy 0O—-c b||x 
cx —az| = c 0 —-a y 
ay — bx —b a O0 2 


228 GÉOMÉTRIE EUCLIDIENNE 


= P5 = (13 — Pp)}X. 
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D'après la relation (x), les coordonnées X’ du point M'—r(M) sont données par 


X' = [Pp + (cos 8)(13 — Ph) +(sin6) V]X, 


autrement dit la matrice de la rotation r dans le repère (O (O;i, k) est 
a? ab ac 1—a? —ab —ac 0 —c 
R= | ba b° bc] +(cos6) | —ba 1—b? —-be | +(sind)| € 0 or 
ca cb © —ca —cb 1— ce —b a 
Puisqu'on a | OM || = | OM || la matrice R est orthogonale. 


Si la rotation r est d’axe k, alors (a,b,c) = (0,0,1) et la matrice est simplement 


cos 0 —sin0 0 
A(8) = 


snmf cosô 0!|.On voit ainsi que le déterminant de r est égal à 1, donc 


0 0 1 
toute matrice de rotation est de déterminant 1. 


Axe et angle d'une rotation. Soit r une rotation de l’espace et soit R sa matrice 
dans un repère orthonormé dont l'origine est sur l’axe de rotation. 


La rotation laisse fixe les vecteurs de l'axe : tout vecteur de l’axe est donc un 
vecteur propre de r pour la valeur propre 1. 

Puisque les matrices R et A(0) représentent toutes eux la rotation r, ces matrices 
ont la même trace, donc 1 + 2cos 0 — tr R. Connaissant une matrice de rotation 
R, on en déduit ainsi immédiatement le cosinus de l'angle. 


Application à l'analyse de données 


On dispose de données numériques sur des entités appelées individus : un individu 
peut être une catégorie socio-professionnelle, une “ile, un magasin, etc. Les données 
portent sur une même liste de caractères communs à tous les individus. 


Exemple. Voici un tableau des prix pratiqués en euro pour les trois mêmes articles 
A, B,C dans trois régions différentes R1,R2, Rs. 

Les individus sont ici les régions. La première colonne du ta- 
bleau est réservée au premier caractère : elle est formée des prix | |5,7,9,5 4,1 
pratiqués pour l’article À dans les différentes régions. Chaque | R2 [6,1 ,8,213,5 
colonne du tableau est ainsi relative à un caractère : une colonne | R3 [7,0 7,9 2,9 


est un vecteur-caractère. 


Supposons qu'il y a p caractères et n individus avec n > p. Comme dans l’exemple, 

formons la matrice des données. 

— Chaque colonne correspond à un caractère : la i-ième colonne est formée des 
valeurs du i-ème caractère chez les différents individus. Les vecteurs-colonnes 
Ci, Co,...,C,, ou vecteurs-caractères, sont dans l’espace R”. 
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— Chaque ligne correspond à un individu : les vecteurs-ligne sont de la forme 


EX1,/X0,...,/Xn, où X1,X2,..., XA sont des vecteurs de l’espace R?. Ces vecteurs 
X1,...,X, sont les vecteurs-individu. 
Gore Cd ! 
X 
X, [tn Ti: Tip | 
X9 T21 22 *'* L2p =|C C2: Cp] = | 
Xn Ti Ln2 °° Lnp L 


Représentons chaque vecteur-individu par un point dans R? : on obtient un nuage 
d'individus formé de n points. L'analyse de données se propose d'étudier la forme 
de ce nuage pour en déduire des corrélations entre caractères et découvrir des 
groupes d'individus dont les caractères s'opposent ou se ressemblent. 


Préparation des données. Afin de réaliser une étude globale, on introduit la 
valeur moyenne de chaque caractère et l’on s'intéresse aux écarts à ce caractère 
moyen. De plus, pour pouvoir comparer des données dont la dispersion dépend des 
unités employées, on opère également une normalisation sur les écarts à la moyenne. 
Aïnsi, on commence par faire subir aux données deux opérations de régularisation. 
Centrage 
Pour chaque vecteur-caractère C4} ER”, notons mx la moyenne de ses coordonnées : 
ME = LErip+ton+ -.. +4), et définissons le caractère centré Cy en posant : 
nm 
T1k Mk 
_ T2k ME 
Cr = 
LTnk ME 
Puisque D, (xix—mx) = (Du dix) — nmx = 0, la somme des coordonnées de 
C'& est nulle. 
Normalisation 
On définit la variance var(C}) et l’écart-type 0% (voir page 70) : 
nm 


var(Cx) = = Cal? = os (rx—mr) et ox = V/var(Cz), pour &—1,2,...,p. 


i=1 


Le caractère centré et normalisé est Dy — L Cr = : Cx. 
Vnok 1C% |] 
Lik Mk : . 2 
En posant yiz = DS pour 1<i<n et 1<k<p, la nouvelle matrice des données est 
NOk 
Di Do +: D, 


Yi Y12 * Yip ty, 
Yai V22 *** Vop ty, 


M 


Uni Yn2 °°: Unp L 
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Considérons les vecteurs-individus Y1,...,Y,. Pour tout k, leurs coordonnées d’'in- 
dice 4 constituent la k-ième colonne de M et comme les caractères sont centrés, on 
a Yi + York +: + Ynrx = 0. Ainsi Y, + Yo +... +Y, = 0, autrement dit : 


le nuage des individus Y1,...,Y, a pour centre de gravité l'origine. 
*l x x 
2 €, 1 
un nuage dans le plan le nuage centré nuage centré 


après normalisation 


Nous considérons maintenant le nuage des individus Y1,...,YA\ dans l’espace IR?. 


Projection du nuage des individus 


Si par exemple chacun des deux premiers caractères est à peu près le même pour tous 
les individus, tout le nuage d'individus se projette à peu près en un même point dans 
le plan des deux premières coordonnées de R? : moins le nuage est dispersé dans un 
plan de caractères, plus les individus se ressemblent pour les caractères considérés. 
On cherche à projeter orthogonalement le nuage sur un plan P 
de R? de manière à perdre le moins d’information possible sur la 
forme du nuage. Appelons Ÿ; le projeté de Y;. Selon la méthode 
des moindres carrés, il s’agit de trouver P pour que la somme 
D, Yi — Yi soit minimale. 


D'après le théorème de Pythagore, on a |Y;||?=||Ÿ;|?+|1Y;-Y;|? : il 


revient donc au même de rendre maximum la somme s=Y ?_.||}|?, 


c'est-à-dire la dispersion des projetés. 


La matrice des covariances. Soit U un vecteur-colonne unitaire dans RP. Pour 
tout vecteur Ÿ € R?, le projeté orthogonal de Ÿ sur la droite engendrée par U est 
p(Y) = (F-U)U et l’on a |p(Y)|| =|Y -U|. Puisque Y -U = (*Y)U = ({U)Y, il vient 


nm 


(5) s= IR -UP = DCUMCVU = (US CYI)u 


i=1l i=1 


Puisque Ÿ; est un vecteur-colonne de RP, la matrice Yi! Y; est carrée de taille p. 


Par exemple, dans le cas de deux caractères et de trois individus ?Y = [71 w|, 
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Y1 
tZ=[z let 'T=[t tl,ona M= | 2] et 
4 


(+202) +707) = [Un wl+ [2] la 214 [2] ta 6) 


D DD : ; 

_ | ytatt Fe = (CM)M 
yayi+222ittoty  Ya+22+to 

Dans la matrice (*M)M, le coefficient en position i-ème ligne, j-ième colonne est 

CDD; c'est-à-dire le produit scalaire dans R” des vecteurs-caractères D; et D;. 


Définition 
Si M est la matrice des données centrées et normalisées, la matrice C = (*M)M 
s'appelle la matrice des covariances. Elle est carrée de taille p et symétrique. 


Dans la matrice des covariances, tous les coefficients sont compris entre —1 et 1 
et tous les coefficients diagonaux sont égaux à 1. 


Les valeurs propres de C' sont positives ou nulles et leur somme est égale à p. 


En effet, les coefficients de C' sont les produits scalaires (*D;)D;. Un produit scalaire 
est inférieur ou égal au produit des normes et les vecteurs D; sont de norme 1, donc 
les coefficients de C' sont compris entre —1 et 1; pour les coefficients diagonaux, on a 
(D;)D; = ||D;|? = 1. D'après la proposition page 217, les valeurs propres de C' sont 
des réels positifs ou nuls. Leur somme est la trace de C' qui, d’après ce qui précède, 
vaut p (page 174). 


Le produit scalaire de deux vecteurs de norme 1 s’interprète comme une corrélation 
entre ces vecteurs : c’est pourquoi l’on dit aussi que C' est la matrice des corrélations. 


Composantes principales 


D'après (+), on a s—({U) C'U et puisque C' est une matrice symétrique, la somme 
s est maximum lorsqu'on choisit pour U un vecteur propre associé à la plus grande 
valeur propre de C' (proposition page 218 et la remarque qui la suit). 

Une telle direction U s'appelle une composante principale pour les données : si l’on 
projette le nuage d'individus sur la droite engendrée par U, la dispersion des points 
projetés reflète au mieux celle du nuage d'individus. 

Considérons les deux plus grandes valeurs propres À et y de C' et supposons À > u. 
Soient U et V des vecteurs propres associés. Puisque la matrice des covariances est 
symétrique, U et V sont orthogonaux dans R?. En projetant le nuage d'individus 
sur le plan P engendré par U et V, on obtient un nuage plan qui ressemble au 
nuage initial du point de vue des positions relatives des individus. 

Cette transformation du nuage s'appelle l'analyse en composantes principales. Le plan 
P s'appelle le premier plan factoriel. Il reste à calculer les projections des vecteurs- 
individus sur ce plan P. 

Choisissons les vecteurs propres U et V de norme 1, de sorte que (U,V) est une 
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base orthonormée de P. Le projeté sur P d’un vecteur Y € R? est Ÿ = aU +bV, où 
a=Y-U=(Y)U et b=Y.V = (Y)V. Formons la matrice [U V] qui a p lignes 
et deux colonnes. Il vient 


y" (YU (M)V ai bi 
‘ YU (M)V @2 b: 
mio vi=| Élpuvy-|(00 CV) ee 
ty. (YU _… An Un 


Dans la base (U, V), l’individu-projeté Ÿ; a pour coordonnées (a;, b;). 


La i-ième ligne de la matrice MIU V | est formée des coordonnées du projeté du 
i-ième individu dans la base orthonormée (U,V) du premier plan factoriel. 


Interprétation de la représentation 


Dans le premier plan factoriel, les projetés Y,Y2,...Ÿ, des individus forment un 
nuage : l'analyse de données consiste à découvrir des ressemblances ou des oppositions 
entre individus en observant la disposition de leurs projetés dans le plan factoriel. 


Qualité de la représentation 


Pour que la représentation plane soit exploitable, les valeurs propres À et y re- 
latives aux composantes principales doivent être assez grandes par rapport à la 
somme p des valeurs propres : autrement dit, les poids \/p et u/p doivent être 
suffisamment grands. 


Des individus très éloignés peuvent avoir des projetés voisins. C’est pourquoi l’on 
introduit, pour chaque individu, un indice de qualité de sa représentation en pro- 
jection. La qualité de représentation d'un individu Y; est |[Ÿ;|?/|Y;|| = (cos4)?, où 4 
est l'écart angulaire entre le vecteur Y; et son projeté dans le plan de représentation. 

Si un individu a une qualité de représentation proche de 1, il est proche du plan 
de représentation et sa distance à l’origine est à peu près la même dans le nuage 
projeté et dans le nuage initial. De même, la distance entre deux points projetés ne 
traduit bien leur distance réelle que si leur qualité de représentation est assez grande. 
Puisque la dissemblance entre deux individus Y; et Y; se mesure par leur distance 
euclidienne |Y;—Y;|, la ressemblance ou la dissemblance entre individus de bonne 
qualité se lit dans le premier plan factoriel. 


— Chacun des vecteurs U et V s’interprète comme une combinaisons de caractères : 
si par exemple les coordonnées de U sont [ui,u2,...,u,], ce vecteur représente 
un « caractère fictif» ayant un taux de corrélation u, avec le premier caractère, u 
avec le deuxième, u; avec le k-ième. Un des objectifs de l'analyse est d'interpréter 
U et V au moyen des caractères définis initialement. 
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La figure ci-contre montre dans le pan U,V les projetés de quelques individus ; le nombre 
entre parenthèses est la qualité de représentation. Les points À,D,E sont de bonne qualité : 
leur distance à l’origine et leurs distances mutuelles tra- 
duisent fidèlement celles des individus correspondants. 
L'individu qui se projette en À a un profil voisin de 
U et celui qui se projette en E a un profil voisin de 
V. L'individu qui se projette en D est composé de -U 
à 64% et de V à 36%. La projection ©, de qualité 


moyenne, n'est guère significative en l'absence d’autres 


renseignements. Il en va de même pour le point B qui, 


bien que très proche de l’axe V, est de mauvaise qualité. premier plan factoriel 


Projection des caractères : le second plan factoriel 


Rappelons que les vecteurs U et V sont des vecteurs propres de norme 1 associés aux 
deux plus grandes valeurs propres À et 4 de la matrice des covariances C', avec À> y. 
Chaque ligne de M est un profil des p caractères. Le caractère fictif U € R? est 
déterminé par les produits scalaires avec ces n profils, c'est-à-dire par le vecteur 
MU de coordonnées [ai,a2,---,a,]. On a 


IMUIF= MO) MU)= (CU)CM)MU=C0)CU= COUT = ICI = À 
donc |MU|| = VX et de même ||MV{|| = V4. Posons 


1 1», 
F= MU et G=——MV. 
VA VE 
Les vecteurs F' et G appartiennent à R” et sont de norme 1. Montrons qu’ils sont 
orthogonaux. On a en effet 


Vu(tF)G = t(MU)(MV) = (U)ÉM)MV = (U) CV = (U)uV = (U)V =0, 


car U et V sont orthogonaux. 

Le plan engendré par les vecteurs F et G s'appelle le second plan factoriel. Les vec- 
teurs (F,G) forment une base orthonormée du second plan factoriel. 

Pour analyser les caractères D:,...,D,, projetons-les dans le second plan factoriel. 
Le projeté D}, de D; a pour coordonnées dans la base (F,G) les produits scalaires 
((Dr)F,(Dr)G), c'est-à-dire la k-ième ligne de la matrice (*M)[F G] qui a p lignes 


et deux colonnes. On a (tM)F=—L(tM)Mmu- 1 AU= VU, d'où le résultat suivant. 
(CM) (M) Fe 


Uj V1 
SU—= |: |et V= |: |, le vecteur-caractère Dy se projette au point D} 


(2 v 


P P 
de coordonnées (VA ur, VE Ur) dans la base (F,G). 
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Puisque D; a pour norme 1, on a |D/,|| <1. Dans le second plan factoriel, D',..., D}, 
forment ainsi un nuage de points, tous situés à une dis- 
tance au plus 1 de l’origine. 
Dans le second plan factoriel, les projetés des ca- 
ractères sont confinés dans le disque de rayon 1 
centré à l'origine. 


La qualité de représentation d’un caractère Dx se me- 
sure par la distance de D} à l’origine : en effet, on a 
(DER + (Dx-DAI2 = | Dal? = 1, done si |D£|| est peu 
inférieur à 1, alors | Dx — D;|| est petit et D, est proche 
de D}. 

Des projections groupées et situées près du bord du disque 
traduisent des caractères bien corrélés : c'est pourquoi le cercle unité s'appelle le cercle 


second plan factoriel 


des corrélations. En repérant des groupes de points proches du cercle des corrélations, 
on découvre des oppositions et des corrélations positives entre les caractères initiaux. 
L'analyse en composantes principales utilise conjointement les représentations dans cha- 
cun des plans factoriels. Il importe de ne pas confondre ces deux représentations qui 


ne se situent pas dans le même espace : il s’agit de R? pour le premier, de R” pour 
le second. Mais on doit croiser les informations tirées de chaque représentation. 


Exemple. On considère des données sociologiques et électorales recueillies dans 
dix-huit villes françaises à l’occasion des élections municipales de mars 2001 : le 
tableau des données figure en annexe, page 578. Il y a huit caractères : 

poptop est la population totale, 

popetr est la population étrangère, 

logsoc est le parc de logement social, 

chomage est le taux de chomage (d’après l'INSEE), 

txhab est le montant de la taxe d’habitation, 

revenu est le revenu annuel moyen par habitant (sur la base des revenus en 1998), 

votants est le nombre de votants au premier tour, 

maj est le pourcentage obtenu par la liste majoritaire. 
Les autres tableaux donnent la moyenne des caractères, leur écart-type, la matrice 
des covariances, les valeurs propres, leur poids, les coordonnées des projections des 
villes dans le premier plan factoriel et leur qualité de représentation. 
Le deux plus grandes valeurs propres ont pour poids respectif 45% et 30% environ : 
le premier plan factoriel a ainsi un poids d'environ 75%, ce qui justifie une analyse 
sur les deux premières composantes principales. La figure 1 ci-dessous montre les 
projections des villes dans le premier plan factoriel. 
Dans le second plan factoriel (figure 2), les caractères bien représentés sont ceux qui 
sont assez proches du cercle des corrélations : c’est le cas du revenu, de la population 
totale, de la population étrangère, du parc de logement social, du nombre de votants 
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et du pourcentage obtenu par la liste majoritaire. 


Facteur 2 — 29,98 % : k F : T . Facteur 2 — 29,98 % 
> ST DENIS RÉUNION « ! "EVRY 
100 RFO 100 
| L 
AMIENS+ REIMS 
1 1 “POITIERS 
200 LERAVRE" BESANCON 200 E 0 
! *NANCY Ï 
. BRESTe 
A BREST > 1 
| + VERSAILLES 
300 STRASBOURG » ï 300 E 
“1 NICE « *TOULOUSE! | 
. 1 ! 
400 ON BOULOGNE BILL+ 400 E ! 
2 MARSEILLE ï ! 
ï l 
500 1 500 E Ù 
3 0 
! NEUILLY | ! 
LT 2 ; û | Facteur 1 — 44,89 % —0,8 —0,4 0 Facteur 1 — 44,89 % 
100 200 300 400 500 600 700 800 100 200 300 400 500 600 
figure 1 figure 2 


Analyse succincte 

a) Dans le second plan factoriel, l’axe F° se qualifie par une opposition entre le revenu 
d'une part et le groupe de caractères population totale, population étrangère et 
nombre de votants, d'autre part. Le caractère logement social est le seul à qualifier 


correctement l’axe G : il s'oppose au revenu qui est assez bien corrélé à ce second axe. 


b) Dans le premier plan factoriel, la seule ville bien représentée sur l'axe U est Mar- 
seille. Amiens et Evry sont bien représentées sur l’axe V. 
Marseille et Toulouse se caractérisent par une forte population totale et étrangère, 
par contraste avec Boulogne et Neuilly qui sont des villes à fort revenus (ces 
quatre villes ont de bonnes qualités de représentation, supérieures à 0,9). 
Evry et Amiens se caractérisent par un important parc de logement social : elles 


contribuent fortement à la qualification de l’axe V. 


Pour une analyse plus signifiante, il faut davantage de données. 


a Exercices emammmmmmx 


1. Une application de la méthode des moindres carrés. Une substance diffuse à travers une 
membrane selon la loi d'action de masse : la quantité non diffusée au temps t s'écrit 
y(t) = yoe Ft, où y est la quantité initiale et k un coefficient positif. Le temps { est 
compté en heures. On veut estimer la quantité y et le coefficient k. On laisse s’éta- 
blir la diffusion pendant une heure et, pendant l'heure suivante, on mesure toutes 
les six minutes la quantité de substance non diffusée ; ces mesures s'effectuent donc 
aux instants to = 1, 1 = 140,1, to = 1+0,2,...,t9 = 1+0,9, ti0 = 2. 
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D 


@ 3. 


Voici les résultats, y; désignant la mesure de y(t;) : 


:10.4110,39/0,34 10,30 10,27 10,21 10,20 /0,1810,17 0,1510,13 


Puisque Iny(t)=—kt+Iny, on cherche la droite de régression 
pour les points (t;,ln y;). Montrer que l’on trouve k = 1,17 
et yo = 1,36. Au bout de combien de minutes la moitié de 
la substance avait-elle diffusé? La figure ci-contre montre 
les points mesurés et la courbe y(t) sur l'intervalle [1,2]. 


0,2 


Exemple d'approximation polynomiale. On veut approcher par 1 

des polynômes de degré au plus 2 la fonction f dont le 

graphe est représenté ci-contre. 

Précisément, on cherche un polynôme P(x)=a+br+cxr? qui 
1 

rend minimum l'intégrale 1(Q) =. [f(E) — Q dt quand —1 0 05 1 
=. graphe de f 


Q parcourt les polynômes de degré au plus 2. Pour cela, 
considérons l’espace vectoriel des fonctions continues sur [-1,1] muni du produit 
scalaire u - v — [ : u(t)u(t) dt et le sous-espace W engendré par les polynômes 1,r,1°. 
a) Calculer f(x) pour —1 < x < 1/2 et pour 1/2<x< 1. 

b) Au moyen de la méthode de Gram-Schmidt appliqué aux polynômes 1,x,x?, 


trouver des polynômes G0,q.g> de degrés respectifs 0,1,2 formant une base 
orthonormée de W. 


c) Montrer que P est le projeté orthogonal de f sur W et calculer les coordonnées de P 
1 1/2 

dans la base (q0,q1,q2). Que vaut la distance d(f,W)=— LL [f(E) — P(t)” dt] de 

f au sous-espace W ? Sur un même dessin, représenter le graphe de f et celui de P. 


On trouve P = (1/64)(17 — 164 + 45t?) et d(f,W) = V38/32 < 2/10. 


Dans l'exemple page 219, l’ellipsoïde €x a pour équation 3x°?+3y°+22?+272+2y2— 

K?, ou encore u? + 3v° +4w° — K? en utilisant les coordonnées u,v,w dans les axes 

orthonormés de &x. Si r est un nombre positif, on note B, la boule de centre l’ori- 

gine et de rayon r : un point de coordonnées (x,y,z2) est dans B, si et seulement 

si + +z<r. 

a) Montrer que dans les coordonnées u,v,w, l'équation de B, est u? + 0? + w? < r?. 

b) Montrer que pour tous nombres u,v,w, on a u? + 0? + w? £ u? + 30? + Au? 
A(u? + v? + uw?) et que les cas d'égalité sont possibles. 

c) En déduire que Bx/2 est la plus grande boule centrée à l’origine et contenue à 
l'intérieur de &x et que BXx la plus petite boule contenant éK. 


. Dessiner une ellipse. On pose f(x, y) = 6x? + 4ry + 9y?. 


a) Écrire la matrice symétrique S telle que f(x,y) = (X)SX pour tout X — Al 
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b) Trouver les axes de l’ellipse € d’équation 6x? + 4xy + 9y? = 40 : ils sont dirigés 
par les vecteurs propres de la matrice S. 

c) Calculer des vecteurs 1 et E2 formant une base orthonormée de vecteurs propres 
de S (le vecteur E1 étant relatif à la plus petite des deux valeurs propres). Mon- 
trer que dans le repère d’origine O = (0,0) et d’axes Æ1,E2, l’ellipse & a pour 
équation 5u? + 10v? — 40. Dessiner cette ellipse en faisant figurer les axes Ox,Oy 
et les vecteurs FE, Fo. 

d) En s'inspirant de l’exercice précédent, montrer que 

le maximum de x? + y? lorsque 6x? + 4xy + 9y? < 40 est égal à 8, 
< k 


ï le maximum de 6x? + 4xy + 9y? lorsque x? + y? ? est égal à 10k?. 


@ 5. Produits scalaires généraux. Soit S une matrice à coefficients réels, symétrique et 
définie positive. 
a) Montrer qu’il existe une matrice diagonale À à coefficients diagonaux strictement 
positifs et une matrice orthogonale P telle que S — P-!'A?P. 
b) On pose M — AP. Montrer que la matrice M est inversible et que S = (‘M)M. 


c) Montrer que le produit scalaire (/X)SX' est le produit scalaire euclidien usuel 
des vecteurs MX et MX". 


6. Soient a,b,c,d des nombres réels tels que a +b+c+d =1. Montrer que la 


a —b c —-d 
matrice 2 _q s. E est orthogonale. 
d c b a 


7. Une pyramide orthocentrique. Dans l’espace euclidien R°, on considère les points 
A=(1,0,—V2/4), B = (-1/2,V3/2,-V2/4), C = (-1/2,-V3/2,-V2/4) et D = 
(0,0,3V2/4). 

a) Montrer que ces points sont les sommets d’une pyramide régulière (c'est-à-dire 
un tétraèdre ayant toutes ses arêtes de la même longueur). Montrer que cette 
pyramide est centrée à l’origine. 

b) Quel est l’écart angulaire entre deux arêtes passant par un même sommet ? 


c) Montrer que des arêtes opposées (comme AB et CD) sont orthogonales. 


@ 8. Rotations et symétries. Dans l’espace euclidien de dimension 3, on choisit un repère 
orthonormé (O:i, j,k). 
a) Trouver la matrice de la rotation d’axe (1,1,1) et d'angle 0. Que devient cette 
matrice lorsque 0 = 27/3? 
b) Quel est le symétrique du point de coordonnées (u,v,w) par rapport au plan 
d'équation x —y+22=07? 
c) Quel est le symétrique du point de coordonnées (u,v,w) par rapport au plan 
d'équation x —y+22z=17? 
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9. Soit M une matrice à coefficients réels, à n lignes et p colonnes. On suppose n > p 


et que M est de rang p. 

a) Montrer que les matrices (‘M)M et M(M) sont carrées et symétriques, de taille 
respective p et n. Montrer que (‘M)M est inversible (considérer la matrice formée 
des p premières lignes de M). 

b) Soit U un vecteur propre de (*M)M pour la valeur propre À. Montrer que 
MU % 0 et que MU est un vecteur propre de M(°M) pour la valeur propre À. 


@ 10. Mouvement apparent pendant une rotation 


11. 


En un point À d’une voie ferrée en courbe, le centre de courbure est en F4 pour 
un observateur situé dans le train, au passage en À, les 


points du paysage ont un mouvement apparent de point 


fixe JT. Supposons que le paysage est dans le plan de la voie 


ferrée et soit # un vecteur de norme 1 orthogonal à ce plan : A 


la vitesse apparente d’un point M est w KAIM, avec w = V/IA 
et V la vitesse linéaire du train en À. Sur la figure, v est le vecteur vitesse du train en À. 
Montrer que les points M qui semblent se diriger vers l'observateur sont situés sur 
un cercle de diamètre ZA (sur une photographie prise vers l’intérieur de la courbe, 
ces points seront les plus nets). 


Un exemple de sous-espace dont l'orthogonal est réduit au vecteur nul 

Soit V l’espace vectoriel des fonctions x+ f(x) continues par morceaux sur [0,+oo[ et 
négligeables à l'infini devant 1/x.Si f et g sont de telles fonctions, le produit f(x)g(x) est 
négligeable à l'infini devant 1/x?, donc l'intégrale généralisée f -g= J hi f(t)g(®) dt existe 
(page 325). Cela définit un produit scalaire sur V. Considérons le sous-espace W des 
fonctions qui valent 0 pour x assez grand : par exemple, pour tout nombre a strictement 
positif, la fonction C, qui vaut 1 pour 0<x<a et 0 pour x > a, est un élément de W. Pour 
toute fonction f € V, la fonction produit fC, qui à x associe f(x)C,;(x), appartient à W. 


a) Montrer qu'il existe des éléments de V qui n’appartiennent pas à W. 
b) Montrer que si f € V, alors f - ( ET f(t)? dt pour tout a > 0. 


c) En déduire que si f est un élément de . orthogonal à W, alors f est la fonction nulle. 
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Chapitre 8 


Des méthodes 
numériques 


1. Norme et conditionnement d'une matrice 


Dans ce chapitre, nous utilisons la norme euclidienne usuelle dans les espaces R”. 


1.1 Norme d'une matrice 


On a souvent besoin de savoir dans quelle mesure une application linéaire modifie 

les normes des vecteurs. 

> Prenons par exemple l'application linéaire de R? dans R qui à tout vecteur X € RP 
associe le produit scalaire C': X par un vecteur-colonne CE R? donné. D'après 
l'inégalité de Cauchy-Schwarz, on a |[C'- X| <||C||||X|| et l'égalité a lieu si C et 
X sont colinéaires. Lorsque X parcourt les vecteurs non nuls de R?, les rapports 
IC: X! 

IX] 

Soit À une matrice à coefficients réels ayant n lignes et p colonnes. Notons 
Ci,C2,...,Ch les matrices-ligne de À. Si X est un vecteur de R?, le i-ème coef- 

Ci X 

Cr X 


ont donc pour valeur maximum |C{||. 


ficient du vecteur AX € R” est le produit scalaire C;- X, donc AX = 

GX 
En notant de la même manière la norme euclidienne dans R” et dans RP? il vient 
IAXI? = (Ci X) + (Co X) ++ (Ca X) < (IC + Co? +2 ICI NIXTÉ 
I AX1/? 
, XI? 
inférieurs ou égaux au nombre (N(A)) = ||Ci|? +1||C2l? +-.-+1CA|? = Y,;., af, 
égal à la somme des carrés des coefficients de À. 


Quand X parcourt les vecteurs non nuls de R?, les rapports restent donc 
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Un rapport | AX|/||X|| reste inchangé quand on remplace X par ÀX : on obtient 
donc tous ces nombres en faisant seulement parcourir à X les vecteurs de norme 1. 
Posons @(X) = ||AX|/|X|| pour X appartenant à la sphère S = {X ER? | |X| = 1}. 
La fonction 4 est continue et S est un domaine compact (page 362), donc 4 atteint son 
maximum en un point de S. 


Définition 

Soit À une matrice à p colonnes. La norme de la matrice À, notée | A||, est le plus 
AX 

grand des nombres rs , quand X parcourt les vecteurs non nuls de R?. 


L'emploi du mot «norme » pour ce nombre se justifie par les propriétés (b}, (c) et (d) 
ci-dessous. 


Propriétés de la norme d'une matrice. Soit A € M, ,(R). 
a) Pour tout vecteur X € RP, on a || AX| < ||A||||X||. 

b) |A] =0— A= 0. 

c) |AAÏ = |A|||A|| pour tout nombre réel À. 

d) Si AE Mn p(R), alors || A + 4'| < || AÏ| + ||4'|]. 

el Si BE Ma(R), alors || AB] < |A|||B||. 


IAX|| 
IX] 
nul XE R?, d’où l'inégalité (a). On en déduit que si |A] =0, alors AX =0 pour tout X, donc la 
matrice À est nulle ; réciproquement, si A=0, alors | AX||—||0| =0 pour tout X.Si À€R, alors 


Démonstration. Par définition de la norme de À, on a 


< ||A|| pour tout vecteur non 


1A)X AX 
LL E l JA me , d'où (c). D'après l'inégalité triangulaire (page 204), on a (A+ A')X|| = 
IAX + A'X| < | AX| + |A'X]|. On en déduit |(A + 4')X| < (|[AÏ + A'DIIX 1]; pour tout 


CA + A”)X || 
IX] 

est une matrice réelle à p lignes et q colonnes, alors pour tout X ER, on a |BX| <||B|||X|| 

et | A(BX)] < AÏIIBXT, donc |(AB)X] =] A(BX)I< IAÏNIBIA, ce qui démontre (e]. m 


vecteur X 20, le nombre est donc inférieur ou égal à | A|| +{|4’|, d'où (d). Si B 


Calculer la norme d’une matrice est rarement commode. Le plus souvent, on se 
contente d’une majoration ou d’une estimation numérique. Voici des exceptions où 
le calcul de la norme est cependant très simple. 


Exemples 

1]Si À est une matrice-ligne, || A|| est simplement la norme de À considérée comme 
un vecteur (voir l'exemple au début du paragraphe). 

2) Supposons que la matrice À est orthogonale de taille n. Dans ce cas, la transforma- 
tion X + AX de R" est une isométrie et | AX||—{||X|| pour tout X, donc |A] =1. 

3) Prenons une matrice diagonale D—diag(di,d2,...,d,). Si X est un vecteur-colonne 
de coordonnées (11,%2,...,æ,), les coordonnées de DX sont (dix1,d%9,...,dntn) 
et [DX|? = dÊxf + dix5 +... + d?x?. Posons m = max (|d|,|d|,...,[dn|). On a 


02 
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IDX | 
IX” 
sont tous inférieurs ou égaux à m, donc aussi le plus grand d’entre eux qui est 
D]. Le nombre m est l’un des |d;| : supposons m = |d;|. Pour le vecteur cano- 
nique E4, on a || Ex] =1, DEz = di, Er, donc | DEz| — |dx|. Ainsi |dx| est le 
plus grand des quotients | DX||/||X||, autrement dit 


I diag(d1, do, .. ., dn)|| — MAX (dif, Ido], .. (da) 


IDX 1? < m2x$ + m?x3 +. + m2x? = m°||X||?. Les nombres où X £0, 


Pour une matrice générale, on a les résultats suivants. 


Proposition. Soit À une matrice à coefficients réels. 
— La norme de À est la racine carrée de la plus grande valeur propre de la matrice (* A)A. 


— Si A possède p colonnes, on a l'encadrement N(A)/,/p < | A] < N(A), où (N(4)) 
est la somme des carrés des coefficients de A. 


Démonstration. Supposons que À possède p colonnes. Pour tout X € R?, on a | AX |? = 
‘(AX)(AX)=(fX)(tA)AX. La matrice S—(fA)A est carrée de taille p, symétrique et ses valeurs 
propres sont des nombres réels positifs ou nuls (proposition page 217). Soit À la plus grande 
valeur propre de S. D’après la proposition page 218 et la remarque qui la suit, on a || AX||? = 
(IX)SX < R||X|? et l'égalité est obtenue quand X est un vecteur propre de S pour la valeur 
propre À. Quand X parcourt les vecteurs non nuls de R?, les rapports | AX||/||X|| ont donc 
pour maximum À. Nous avons déjà démontré en introduction l'inégalité || A|£N(A). La i-ème 
colonne À; de À est AE;, où E,; est le i-ème vecteur canonique, donc ||A;||—| AE;||<||A||||E;||= 
|A], car E; est de norme 1. En élevant au carré et en ajoutant ces inégalités pour i—1,2,...,p, 
on obtient p||A|? > ||A1|?+1|A42|?+:::+14,|?= (N(4))”, d'où l'inégalité |A] > N(A)/,/p. 0 


Calcul numérique de la norme d'une matrice 


Première méthode. Pour avoir une estimation de la norme d’une matrice À à 
n lignes et p colonnes, 


- on génère des vecteurs À € R? au hasard, 

y 

[xl 

- et l’on prend le plus grand de ces nombres r comme valeur approchée de ||4||. 


on calcule Y = AX et le rapport r = 


Si l'on a pris suffisamment de vecteurs X et s'ils sont assez dispersés, r est une 
bonne approximation par défaut de la norme de A. 


Seconde méthode. Si p n’est pas trop grand, on peut aussi calculer le polynôme 
caractéristique f(x) de la matrice (*A)A et chercher une valeur approchée de la plus 
grande racine max de f ; on a alors une valeur approchée de | A] = Aux. 
Puisque le polynôme f a toutes ses racines réelles, la méthode de Newton est tout 
à fait adaptée au calcul de la plus grande racine (voir pages 307 et 309). 
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Rappelons que la suite de Newton est définie par son premier terme x, et la 
(tn) 
F(an) 


2 : Li 
To = (N (A)) , alors x, tend rapidement vers À, par valeurs supérieures. 


relation Zyi1 = Zn — . Si l’on choisit x0 plus grand que Àx, par exemple 


La méthode de Hôrner (page 48) permet un calcul efficace des nombres f(x,) et 


Pt): _1492 138 17,4 10,0 
_86 188 170 16,0 
Exemple. Soit A — | —19,0 12,2 —19,4 12,2 


9,8 10,0 12,4 12,6 
44 0,4 10,8 —4,8 

a) Posons 76 —3311 > (N (4). Dans la suite de Newton pour le polynôme caractéris- 
tique de (*A)A, le terme xs — 2049,8363... approche la plus grande racine à 107? 
près. En prenant la racine carrée, on obtient ||A|| = 45,275118, valeur approchée 
par excès à 10? près. 

b) Voici les résultats obtenus avec la première méthode. La première ligne du ta- 
bleau indique le nombre de vecteurs X € R‘ générés au hasard et la deuxième 
ligne donne r = max (|| AX||/||X||), valeur approchée par défaut de |A]; dans la 
troisième ligne, on a calculé l'erreur relative (||A]| — r)/||A||. 


nombre d'essais 10 25 40 55 70 85 100 
valeur approchée de ||A|| | 39,06 | 44,14 | 43,36 | 43,54 | 43,95 | 44,24 | 44,39 
erreur relative 0,13] 0,02] 0,04! 0,04! 0,03! 0,02] 0,02 


1.2 Conditionnement d'une matrice 


La résolution de certaines équations linéaires AX = B présente des difficultés inatten- 
dues : de petites variations sur les coefficients du vecteur B produisent de grandes 
variations sur la solution X. Cela est très gênant, car dans la pratique numérique, 
les coefficients de B, et même de À, ne sont en général connus que de manière 
approchée. Ce type d'erreur s’ajoutant aux inévitables arrondis commis pendant la 
résolution, la solution calculée n’est plus fiable. 


Exemple (d’après RS. Wilson). Posons 


107 8 7 32 0,1 
A= scan ol 2-3) « dB=|"01 
75 910 31 1 —0,1 
La solution de l'équation linéaire AX = B est X — i ; 
1 9,2 
et si l’on pose A(X + dX) = B + dB, on obtient dX — Tue 
1,1 
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|dB|| 
|B1| 
la solution une variation relative vu X — 


qui vaut environ 3,3.10 * provoque dans 
IdX | 


IX] 


La petite variation relative vB — 
d'environ 8,2, soit un taux vX/vB 


supérieur à 2450. 


Donnons-nous une matrice carrée À inversible de taille n et un vecteur-colonne 
BE R”. Soit X la solution de l’équation linéaire AX — B. Modifions B en B +dB, 
où dB € R" : la solution devient X + dX, telle que A(X + dX) = B + dB. 

On a A(dX) = dB, donc dX = A-!(dB) et ||dX|| < ||A-!|||dB]||. En multipliant par 


l'inégalité ||B|| < || A|||X|, ü vient ||B|||4X| < |A] AIX | 4B|, d'où 
|dX|] 1, 11dB| 
TE paquet 
IX] 181 
Définition 


Soit À une matrice carrée inversible de taille n. Le nombre | A||||4-!|| s'appelle 
le conditionnement de À et se note cond(AÀ). 


Pour une matrice diagonale inversible D — diag(d;,d»,...,d,), le conditionnement 


max |d; 
est le quotient cond(D) = 18 


min |d;| 

— Puisque 1, = A(A ?), il vient 1=|Z,||—||A(4°1)]|<||A|||[A71|| d'après les propriétés 
de la norme. Le conditionnement est donc toujours supérieur ou égal à 1. 

- On a l'égalité cond(A) = cond(A-!). 


Proposition. Soit À une matrice inversible de taille n et soient B et dB des vecteurs- 


dx dB 
colonne de R". Si AX = B et A(X +dX) = B+dB, alors TT < cond(4) TT. 


Calcul du conditionnement 

On peut calculer les normes ||A|| et |[|A-!|| comme au précédent paragraphe. Dans 
l'exemple précédent, on trouve ainsi que le conditionnement vaut environ 2984 
IdX]|. Id] 


et ——— obtenus). 
IX] |B1 


(valeur compatible avec les rapports 
On a aussi la formule suivante. 


Proposition. Soient À, la plus grande valeur propre de la matrice (*A)A et À la 
plus petite. Alors cond(A) = 4/Anax/ min. 


Démonstration. Posons $ — (‘4)A et rappelons que toutes les valeurs propres de S sont 
strictement positives, car À est inversible (proposition page 217). Pour toute matrice inver- 
sible P de taille n, la matrice P!SP a mêmes valeurs propres que S. En choisissant 
P =‘A, cela montre que Ain est la plus petite valeur propre de P-!SP = AfA. Les valeurs 
propres de l'inverse d’une matrice sont les inverses des valeurs propres de cette matrice, donc 
1/Amin est la plus grande valeur propre de (A‘A)-! —{{A-1)(A-1). Par conséquent, on a 


A1] = 4/1/Amin. Puisque |A] = VA, le résultat s'ensuit. = 
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Soit f le polynôme caractéristique de (*A)A. L'équation f(1/x) —0 a pour solutions 
les inverses des racines de f et 1/Aun est la plus grande de ces solutions. Posons 
g(x)=x" f(1/x), où n—deg f est la taille de la matrice (*A)A ; alors g est un polynôme 
de degré n et l’on peut calculer 1/X,3 en appliquant la méthode de Newton à g. 


Estimation pratique. La formule de la proposition est valable pour toutes les per- 
turbations dB du second membre, notamment celles qui provoquent la plus grande 
variation sur la solution X ; mais dans la pratique, un vecteur dB au hasard ne 
provoquera que des variations dX nettement inférieures au maximum prévu par le 
conditionnement. On se contente donc souvent d'estimer numériquement un coeffi- 
IX dB] 
x] SA TE 
IX] 1B1] 
second membres B et suffisamment de perturbations dB prises au hasard : 


cient C(A) tel que l'inégalité 


soit valable pour suffisamment de 


on génère un assez grand nombre de vecteurs B et dB au hasard, 
on résout les équations AX = B et A(X + dX) = B+dB, 


- on prend comme valeur de C(A) le plus grand des nombres 


—1 
dx | on 
IXÏ LB 


Le nombre C(A) est en général bien inférieur au conditionnement, mais, en pratique, 
il n’est pas déraisonnable de l'utiliser pour des calculs d'erreurs. 


Résolution d'équations linéaires 


Dans ce paragraphe, on considère des équations linéaires AX = B, où A est une 
matrice inversible de taille n à coefficients réels ou complexes. 


2.1 Factorisation LU 


Lorsque la matrice À est triangulaire, l'équation linéaire AX — B se résout facile- 
ment : si par exemple À est triangulaire inférieure, la première équation fournit x1, 
première coordonnée de la solution X = (%1,%2,...,%,), puis en reportant dans la 
deuxième équation, on obtient 2 et ainsi de suite; si À est triangulaire supérieure, 
il faut commencer par la dernière équation et remonter jusqu’à la première. 

Prenons une matrice À produit de matrices triangulaires, par exemple À = LU, où 
L est triangulaire inférieure et U triangulaire supérieure. Puisque A est inversible, 
L et U le sont aussi : en effet, det À = (det L)(det U) est non nul, donc L et U ont 
des déterminants non nuls. Si C’ est le vecteur tel que LC'= B, alors on a 


AX = B LUX = LC UX —=C, car L est inversible. 


La résolution de l'équation AX — B peut donc s’opérer en deux étapes plus simples : 
- résolution de l'équation triangulaire LC'= B, 
puis résolution de l'équation triangulaire UX = C. 
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Nous allons montrer que moyennant une hypothèse souvent satisfaite, on peut 
calculer efficacement des matrices L et U telle que À = LU. 


Recherche de la factorisation 

On dit qu’une matrice À possède une factorisation LU s’il existe une matrice L 
triangulaire inférieure à coefficients diagonaux tous égaux à 1 et une matrice U trian- 
gulaire supérieure, telles que À = LU (l'appellation « LU » vient de l'anglais «lower 
triangular » et «upper triangular »). 

Notation : Si M] est une matrice carrée d'ordre n et si k est un entier tel que 
1<k<n, notons M) la matrice carrée de taille k formée avec les k premières 
lignes et les k premières colonnes de M. 


1 0 0 Ui1 U12 U13 
Aïnsi par exemple, pour L= | {x 1 0] et U—= | 0 ux ux|,ona 
ls U32 1 0 Ou 
L® = 11] U® = [un] LOU) = [us] = (LU)® 
all 4 (2) — 6 | ()rr@) | ui u12 | _ (2) 
7 Le 1 # O u» ne Liu Lori + u» (ZU) 


et plus généralement, pour des matrices L et U de taille quelconque, on a LU(*) = 
(EU 
Si À = LU, alors L et U sont inversibles (car À est inversible), donc leurs coefficients 
diagonaux sont tous non nuls. Par suite, les matrices L() et U(*) sont inversibles et 
le déterminant de A) = (LU )(#) = LU) est non nul. Pour que la matrice À se 


factorise en LU, il faut donc que les déterminants des matrices A) soient tous non 
nuls. La proposition suivante affirme que cette condition est aussi suffisante. 


Proposition. Soit À une matrice inversible. Si toutes les matrices AU) ont un détermi- 
nant non nul, alors À possède une factorisation LU unique. 


! 
Démonstration. Décomposons A sous la forme À= Fe Ê] , où À’ est carrée de taille n—1, 


P est une matrice-colonne à n—1 lignes, Q est une matrice-ligne à n—1 colonnes et a € R. 


! É 5 
Cherchons aussi L et U sous la forme L=— Es ‘| et U— Fe | . L'égalité LU = À équivaut à 
L'U'=A', L'Y=P, XU'=Q et XY +u=a. Pour montrer l'existence de L et U, raisonnons par 
récurrence sur la taille de la matrice A. Les matrices 4/(41)= 40), 4/2) 40), 4/(n-1) 2 Ant) 


ayant leur déterminant non nul, la décomposition 4’ = L'U" existe par hypothèse de récur- 
rence. Les équations L'Y = P et XU’ = Q ont une solution car L' et U’ sont inversibles et 
l’on pose u=a— XY : cela définit les matrices L et U.Si À = LÜ est une (autre) factorisation 
LU, alors la matrice LIL = UÜ-! est triangulaire supérieure et triangulaire inférieure avec 
des 1 sur la diagonale, donc L'iL=UÜ-1- I, et L = LE; Ü =U. ] 
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Pratique des calculs 
On calcule les matrices L(*) et U(*) de proche en proche, jusqu’à L=L(") et U=U(") : 
> JU) — [1] et U® = AU); 
- Si l’on a calculé L(*) et UF), on pose comme dans la démonstration précédente : 


Len 2 |LI® 0! parmn [UM y] à au _ |A P 
/ 0 u Q al 


avec a et u des scalaires ; on calcule alors la matrice-colonne X et la matrice-ligne 
Y en résolvant les équations LÜ)Y = P, XU() = Q, puis on obtient le scalaire u 
au moyen de l'égalité XY +u = a. 
Pour calculer L et U lorsque À est de grande taille n, le nombre d'opérations à 
effectuer (additions, multiplications et divisions) est de l’ordre de n». 


2.2 Méthode de relaxation 


Au lieu de résoudre algébriquement l'équation linéaire AX = B, on peut chercher 
à approcher la solution par des vecteurs X{0), X(),..., X(k),... qui tendent vers la 
solution. Voici une méthode couramment pratiquée pour construire une telle suite. 
Hypothèse générale : la matrice A—[a;;] est inversible et ses coefficients diagonaux 
a;; sont tous non nuls. 

On note b;,b2,...,b, les coordonnées du vecteur B. 


Construction des vecteurs X (*) 
Pour définir une méthode de relaxation, on se donne un nombre w tel que 0 <w < 2. 


- On choisit un vecteur initial X(). 


- On passe de XF) — (x®, 2, de ,a)) à X(EH) — [CNE at, Le. FE) en 
appliquant la formule suivante pour à —1,2,...,n: 
2—1 n 
û 0 = 0 + L( D ae? — D aa) 
Li j=1 j=i 
où l’on convient que si à — 1, le signe  . donne comme résultat 0. 
Par cette formule, on calcule successivement ee M EU : ag, connaissant X(K). 


Supposons que les vecteurs X(*) tendent vers une limite X quand k tend vers l'infini. 


Pour chaque valeur fixée de i, on peut passer à la limite dans l'égalité (1) : en notant 

T1,%9,...,æn les coordonnées de la limite X, on obtient x;,=x;+ U — + at), 
ii 

donc 0 = b; — ne &ijtj ; puisque la somme est la i-ième coordonnée de AX, on 

a B = AX. Cela montre que 


si les vecteurs XV) ont une limite, cette limite est la solution de l'équation AX = B. 
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Algorithme de passage de X(F) à X(%+1) 
La programmation est très simple : 
initialisation : [æ1,%,...,æn] — XW) 


boucle : pour à de 1 à n, faire 


s— 0 
pour j de là n, faire s+ s+a;;x; 
réb; —s 
Di = D + wr/ ai 
fin : XEH) € [xi,æœ0,...,ænl 


Test d'arrêt 
Pour tout k, on calcule le « résidu » r%) = B — AX() et l’on s'arrête si 


[rt 
IB1] 


<E , où € est une précision choisie. 


Notons el*) = X — X{X) l’erreur commise en s à la k-ième itération. 

On a AX=B et AXW = B -rW), donc Ae%) = AX — AXÛ = 57%) et |[e)]] = 
NA Er < LA 217 PL 

Après un test d’arrêt positif, on a |e)||<e||A-1||||B||<e|| A7] A|IIX||. Pour l'erreur 
relative, il vient donc la majoration 


La matrice d'itération 

Nous allons voir que les vecteurs X(*) sont les itérés de X(0 par une transformation 
affine de la forme X — Z,X + K, où Ÿ, est une certaine matrice ne dépendant 
que de À et de w. Décomposons la matrice À en trois matrices D, E, F': 


la matrice D est la matrice diagonale diag(a1,a22,..., nn) formée des coefficients 
diagonaux de A (supposés tous non nuls); 


— la matrice (—E) est la partie triangulaire strictement en dessous de la diagonale; 


la matrice (—F) est la partie triangulaire strictement au dessus de la diagonale. 


À = : D 
—E 
La formule (1) s'écrit XD = XW + GDI[B+EXEH 4 (Fr - D)XW)], ou encore 
(In —wDTE)X 84 2 [(1 -w)I, +wD F]X%) +wD B 


CuaAPirRe 8 - DES MÉTHODES NUMÉRIQUES - 249 


En posant 0 po =%2 03 ,.. Ain 


— G21 .. 0 11 di1 di1 
a22 e —G23 — An 
| a a 
= 431 —@32 :. _ 22 22 
L=D !E= : et U=D !F= , 
a33 a33 Vs ë 
L 0 L —An-in 
ni —An2 —Ann—1 0 An—in—1 
Ann Ann Ann 0 


il vient (7, —-wL)X 440 2 [(1 -w)1, +wU]X® +wD-1B. La matrice triangulaire 
1h — wL est inversible, car ses coefficients diagonaux sont tous égaux à 1. On a donc 


XBH) 2 (1, —wL) 1[(1 -w)7, +wU]X® +w(r, -wL) D 1B 
et en posant %,=(1,-—wL) '[(1-w)1,-+wU] et K=w(I,-wL) DB, on obtient 
(2) XU+H) 2 g,XW + K, pour tout entier k > 0. 


La solution de l’équation linéaire AX = B est le point fixe de cette transformation. 
D'après le corollaire page 185, on en déduit : 


pour que la suite de XV) converge quel que soit le vecteur initial X0, 
il faut et il suffit que la matrice d'itération Ÿ, ait toutes ses valeurs 
propres (réelles ou complexes) de module strictement inférieur à 1. 


On a (1, —-wL)P, = (1—-w)1, +wU et la matrice triangulaire 1, —wL a pour déter- 
minant 1, donc det Z,, = det[(1 — w)1, +wU] = (1—w)". On sait que le déterminant 
d'une matrice est le produit de toutes les valeurs propres réelles ou complexes. Si les 


valeurs propres de Z, sont de module inférieur à 1, alors en faisant leur produit, il 
vient |1—w|" <1, donc |1—-w| < 1; puisque nous avons pris w réel, cela implique que 
w est strictement compris entre 0 et 2. La condition 0 < w < 2 est nécessaire pour que 
la méthode de relaxation converge quel que soit le vecteur initial X0. 


Des conditions suffisantes de convergence 

Dans les applications, la matrice À est souvent bien particulière, par exemple symé- 
trique ou tridiagonale (voir page 142); il est également fréquent que les coefficients 
diagonaux soient prépondérants au sens de la définition suivante. 


Définition 

Une matrice carrée À = [a;;] est à diagonale strictement dominante si le module de 
chaque coefficient diagonal est strictement supérieur à la somme des modules des 
autres coefficients situés sur la même ligne : pour tout à, |a;;| > D 4; la. 


Proposition. Toute matrice carrée à diagonale strictement dominante est inversible. 


Démonstration. Soit A=[a;;] une matrice carrée de taille n à diagonale strictement dominante 
et soit X un vecteur-colonne non nul, de coefficients 11,%2,...,2,. Choisissons un coefficient 
x, de module maximum : [x,|2>|x;| pour tout j. Puisque X n’est pas le vecteur nul, x, est non 
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nul. Le coefficient d'indice q du vecteur Y = AX est y, = 75 GT = GggTa + D gai 
Puisque le module d’une somme est inférieur ou égal à la somme des modules, on a 
D j#g AaiTj 
car À est à diagonale strictement dominante et |x,| # 0. On en déduit que y, n’est pas nul. 
Ainsi, pour tout vecteur X Z 0, on a AX 0 : la matrice À est donc inversible. = 


< D ja laaslltsl < ITal ja laail < lGallagal et la dernière inégalité est stricte 


Proposition. La méthode de relaxation converge dans chacun des cas suivants : 
a) la matrice À est à diagonale strictement dominante et 0 <w <1; 
b) la matrice À est symétrique définie positive et 0 < w < 2. 
Démonstration. On a (1, -wL)®,, = (1—-w)l, +wU, donc 
(ln —wL)(Z,, — 213) = (1 —w —2)14 + wU + zwL 
et comme J,, —-wL a pour déterminant 1, le polynôme caractéristique de Ÿ,, est 
P(z) = det(Z, — 21,) = det[(1 —w — 2)1, + wU + zwL] 


Supposons 0 < w < 1 et soit z un nombre complexe tel que |z| > 1. Puisque 0 <1—w <1, on 


a l—-w-— 240, donc P(z) =(1-—w -— z)" det(f, + bU + aL), où l’on a posé a = —2# et 
b= — D'autre part, l'inégalité |z|(1—w) >1—w s'écrit |zlw <|z| —(1—w) êt commé on 
—wW—2 
a [1—w—2|2>|z]-(1—-w)>0 d’après l'inégalité triangulaire, on en déduit |a| = TE <1. 
—w—2 


Puisque w < |zw|, il vient |b] < [a] < 1. Supposons que À est à diagonale strictement do- 
minante. Alors 1, + U + L est à diagonale strictement dominante (voir les matrices U et L 
page 250); la matrice 7, + bU + aL s'obtient en multipliant les coefficients non diagonaux 
par des nombres de module au plus 1, donc J,, + bU + aL est aussi à diagonale strictement 
dominante : ainsi cette matrice est inversible, donc de déterminant non nul. Finalement, si 
|z| > 1, alors P(z) 0. Cela montre que les valeurs propres de la matrice Ÿ,, sont de module 
strictement inférieur à 1, donc la méthode de relaxation converge. 

Supposons maintenant À symétrique définie positive et 0 < w < 2. Posons pour simplifier 
B=%, et M = 1D-E. La matrice triangulaire M est inversible et un calcul simple montre 


que l’on a M(I, L B)= A, ou encore B=1,, — MA. En utilisant l'égalité A = À, on vérifie 
en outre la relation suivante : 

(+) A— (B)AB = (1, —-'B)(M +'M — A)(I, — B) 

Puisque À est symétrique, on a tE=F, ‘M=— 2 D-F et M+tM—A= . D-E-F-A= ns 
car A+E+F=D. Les coefficients de D sont les produits (Es) AE, donc ils sont strictement 


positifs puisque À est définie positive. Il s'ensuit que la matrice diagonale À — 2=U P est dé- 
w 
finie positive, car on a 0 <w <2. Soit À une valeur propre de B et X un vecteur propre associé 
(puisque À est symétrique, À est un nombre réel). On a BX = AX et (1, — B)X =(1-—A\)X. 
En multipliant les différents termes de (x) à gauche par *X et à droite par X, on obtient 
(X)(B)ABX = X(X)AX et (?X)(1, —'B)A(I, — B)X = (1— )X)/(X)AX, d'où 
(— V)ÉX)AX = (1 — 1) (ÉX)AX. 

Remarquons que À ne peut pas être égal à 1 : sinon on aurait X = BX = X —- M-!'AX, 
donc M-!'AX = 0, ce qui n’est pas possible car X est non nul et les matrices M7! et A 
sont inversibles. Ainsi on a (1— À)? >0, (X)AX >0 et (IX)AX > 0, donc aussi 1 — À? > 0, 
c'est-à-dire —1 < À < 1. ü 
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2.3 Résolution numérique d'une équation de Poisson 


Le problème. On considère une plaque en équilibre thermique : en tout point, la 
température u n’est fonction que des coordonnées (x,y) de ce point. La plaque est con- 
venablement isolée sur ses deux faces de sorte que la conduction s'exerce dans son plan. 


Le flux de chaleur est proportionnel à la section traversée, au gradient de température 
(2 ou) et à la conductivité c, qu'on suppose uniforme. 

Exprimons l'équilibre thermique d’un petit volume découpé dans la plaque. 

La face en x a pour surface eôy, où e est l'épaisseur 


(constante) de la plaque. Le flux rentrant par cette face est 7 


donc —ce y Su (a, Yo), le signe moins venant de ce que 
x 


le flux de chaleur se fait dans le sens des températures 


décroissantes. 
To To + 0 
Le flux sortant par la face en 0 + 0x est de même 
—ce Sy ot (to + 0x, Yo). 
En négligeant (5x)?, il vient Où (%0 + 0%, Yo) = d (%0 yo) + ee (22) 0x. Le flux qui 
: Ox ’ x" ” 0x \ x 


traverse le volume dans la direction x est donc 


2 
RU Ôx Ôx ii x \ 0x . FU. T2 


la dérivée seconde étant prise en (%0,Yo). De même, dans la direction y, le flux est 
ÿ2, 

ce EE Puisque l'équilibre thermique est supposé atteint, le flux total à travers 
) 


l'élément est nul : 
d’où l'équation de Poisson 


Pour simplifier, nous avons supposé idéalement que la plaque n’échangeait pas de 
chaleur avec l'extérieur. Dans le cas général où l’on a une distribution de chaleur 
f(x, y) en tout point de la plaque (réalisée par exemple en insérant un circuit 
chauffant ou réfrigérant), l’état d'équilibre se traduit par l'égalité 
Du 
9x 


du 
+ 1 
dy? Î 


et le problème est de calculer la fonction u connaissant son laplacien Au = f ; pour 
déterminer la solution, il faut imposer les valeurs de «x aux bords de la plaque. 


252 - RÉSOLUTION D'ÉQUATIONS LINÉAIRES 


© Dunod -— La photocopie non autorisée est un délit. 


Discrétisation. Utilisons l’approximation de la dérivée seconde présentée page 
141 : pour une fonction numérique (x,y) + u(x,y), le nombre 


. [u(z — h,y) — 2u(x,y) + u(x + h,y)] 
2 
est une bonne approximation de Da (y) si À est assez petit. En tout point (x,y), 
T 
2 2 
on peut donc approcher ei De ai par 
Ôx? dy? 


(+) Lu(æ—h, y) — Qu(x, y) + u(x+h, y)] + - Lu(æ, y—k) — 2u(x, y) + u(æ, y+H)] 


à la condition que h et k soient assez petits. 
Supposons que la plaque est un carré ABCD de côté { et plaçons-nous dans des 


conditions théoriques où l’on maintient une tempé- u=T 
rature constante de zéro degré sur les côtés AB et B C' 
AD, et une température T sur BC et CD, sauf aux 
points B et D où la température n’est pas définie. mr (le 
e Es 


Subdivisons la plaque en seize carrés de côtés {/4, 


ce qui fait apparaître neuf points intérieurs qu'onnu- = en | | = 
mérote comme sur la figure par les couples (i,j), où 


U31 |'U32 |'U33 


1<i<3 et 1<7<3. Nous allons estimer la tempé- 


rature u;; en chacun de ces points, sous l'hypothèse A D 
d’un état stationnaire. u=0 
Les solutions doivent 4 priori présenter une symétrie par rapport à la diagonale AC. 
2 
Au point (1,1), est approché par (1/h?)(0 — 2u11 + ur), 
TX 
2 
est approché par (1/k?)(uoi — 2u11 + T). 
P : / CE = a 14 :LA : ou ou _ 
uisqu’on a ici À — k = {/4, l'égalité de Poisson D? + Fe jaS 0 donne 
En y 


O+T + u39 + ua — du = 0. 


Procédons de même pour les autres points (4,5) ; en les ordonnant par balayage des 
lignes, on obtient le système linéaire carré : 


— Aus + U2 + ui =-7T 
Uri — Auio + U13 + U22 =-7T 
üu12 — dus + U3 = —2T 

ui — Auoi +  U22 + ui = 0 
U12 + Ua — dus + 93 + U32 SL 0 

U13 + U22 — Aus +'ug= -T 

U1 — Aus + U32 — 0 

U22 + Ug1 —Auss + Uu33 = 0 

U23 + u32 — Aus = — T 
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de matrice 


OODOnOhRRBR 


OODORhAOCOOBRARO 


OORhROMROOH 
| 
OhOrRroro 


hROOCOBrhROhRO©OO 


Oh OORhROOO 


hÈhOh©OO©CCO 


(es) 

] 
OOOOORhROME 
Br Oh OOOCOCO 

] 


ed 


et où 0 représente la matrice carrée nulle de taille 3. Le premier membre du système 


M 13 0 U: Ui1 U21 U31 
s'écrit aussi | Z3 M 13 Un |, en posant Ui = | w2 |, Uo = | u22 | et U3 = | uz |. 
0 13 M U3 U13 U23 Uu33 


Remarquons que la taille de la plaque et ses propriétés thermiques n'interviennent 
pas dans le système (invariance d'échelle). 

La matrice S est à diagonale strictement dominante; elle est aussi symétrique et 
comme les coefficients diagonaux de —S sont strictement positifs, —S est définie 
positive (exercice 3). Observons que la matrice M est tridiagonale. 

Avec la méthode de relaxation pour w = 0,8 et en prenant le vecteur initial dont 
toutes les coordonnées valent 0,57, on obtient en quatre itérations la solution 


U1=U22=U33—0,5T 3 Uu12=U23—0,714T , U21=Uu32=0,285T ; u13=0,857T ; u31=0,142T 


avec une erreur relative inférieure à un centième. 


Généralité de la méthode. Dans les applications, on utilise une subdivision 
beaucoup plus fine et la matrice du système est de grande taille. Supposons qu'il 
y a n? points dans la subdivision; ordonnons-les en parcourant ligne par ligne (ou 
colonne par colonne); en utilisant l’approximation (+) du laplacien, on obtient la 
matrice carrée de taille n? 


M I, He 
IL MI, 0 a b & 0 
= Lu nul a ua Last 4e 2.2 
: : A ; à : 2 h2 k2 
0 LMI le ba 
I, M a b 


La matrice S est toujours symétrique à diagonale strictement dominante et —S 
est définie positive. La méthode de relaxation est donc appropriée pour résoudre 
numériquement une équation de Poisson. 


Quand le domaine est moins régulier, on le subdivise par des triangles pour mieux 
épouser son bord. 
Remarque 


De nombreuses équations aux dérivées partielles font intervenir, comme l'équation 
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de Poisson, le laplacien de «x défini, dans le cas d’une fonction de deux variables 
2 2, 
cartésiennes, par Au = a + a L'opération u + Au est linéaire. 
Œ y 
Par exemple, pour étudier les vibrations d’une membrane ou la surface d’un liquide en 
mouvement dans un bassin, on est amené à résoudre l'équation Au = —k?u : les solu- 
tions u sont des vecteurs propres de l'opérateur laplacien (voir l'exercice 11 page 573). 
En utilisant la méthode de discrétisation précédente, on est conduit au système linéaire 


SU — —kK?U et à calculer les valeurs propres de S. 


Calcul de valeurs propres 


Si À est une matrice carrée de grande taille, calculer son déterminant est très coûteux 
en nombre d'opérations : passer par le polynôme caractéristique n’est donc pas toujours 
numériquement efficace pour trouver les valeurs propres. De plus, on n'obtient en gé- 
néral qu’une valeur approchée À de la valeur propre, de sorte que l'équation linéaire 
AX = )X n'a pour solution que le vecteur nul : utiliser ce système pour le calcul d’un 
vecteur propre présente de sérieuses difficultés. Voici une méthode itérative qui, lors- 
qu’elle converge, produit des vecteurs X} ayant pour limite un vecteur propre de À. 


Un exemple. Soit la matrice A = Ë “ de valeurs propres 1 et 10. Posons 


Yo = LE X0 = + et appliquons l'algorithme suivant : 


oil 
(à) Yk « AXk 
pour k de 1 à p, faire (ii) Xx + 1 Ys 
IX | 


Pour p—4, on obtient le vecteur X, de coordonnées (0,6139..., 0,7893...) et les 
coordonnées de AX, sont (6,139... , 7,893...) ; ainsi AX4 est peu différent de 10 X4, 
autrement dit le vecteur X, est à peu près propre pour la valeur propre 10. Pour 
des valeurs de p plus grandes, la précision s'améliore. 


Explication. Les vecteurs X4 sont obtenus en itérant Xo par la transformation 


W + AW et en divisant chaque fois par la norme. On a A* = ke ne | , AVEC GA — 
10F—1 ET Re [u]= 
7 ,etil vient W;=A"X, "à Y Ve 210% l' Posons . =W;. Alors 
Ug ae s Uy y. 06 4. ‘10-1 
—10 et comme a; tend vers l'infini, on a lim lim Le 10. 
Uk—1 Uk—1 ak—1 10° —1 


Ainsi le rapport des coefficients entre W% et Wx%-_1 tend vers 10 quand k tend vers 


l'infini. Puisque Xy% = , on passe aussi à peu près de Xz-1 à XX en multi- 


Wx 
I Wx|| 
pliant par 10, lorsque k est assez grand. Si les Xx% tendent vers un vecteur X, on a 
donc AX — 10%, autrement dit X est un vecteur propre pour la valeur propre 10. 
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En calculant les formules générales pour les coefficients de X}, on voit facilement 
que lim X, est colinéaire au vecteur V — Lo] qui est propre pour la valeur propre 


10 (exercice 5). 


Hypothèses 
Dans la suite, À est une matrice carrée non nulle de taille n à coefficients réels (pour 
une matrice complexe, voir la fin de la remarque page 257). 
a) On suppose que l’une des valeurs propres de À, disons À, est de module strictement 
supérieur aux autres et que À est valeur propre simple. 
b) Xo est un vecteur ayant, dans une base de trigonalisation, une coordonnée non 
nulle relativement au vecteur propre associé à À. 
L'hypothèse (a) implique que À est réel : en effet, puisque A est à coefficients réels, le 


nombre conjugué À est une valeur propre de même module que À, donc À n’est pas 
différent de À. 


1 


Proposition. Définissons les vecteurs Y, et Xy, en posant Yi = AXy_1 et Xy = TA Yx 
k 


pour k > 1. Alors 
iles nombres ||Y;|| tendent vers |À| 
ü) les vecteurs EX X3, tendent vers un vecteur propre pour À, où £=1 si À>0 et e=—1 si À<0. 


Q nr où T est de 


taille n—1 et triangulaire ; les coefficients diagonaux À2,...,, de T' sont des valeurs propres de 
B autres que À. Par hypothèse, on a [A|>|A;|, donc À n’est pas nul et les coefficients diagonaux 
de la matrice À!T sont de module strictement inférieur à 1 : il s'ensuit que (À71T)* tend vers 


Démonstration. Traitons d’abord le cas d’une matrice de la forme B = | 


0 quand k tend vers l'infini (proposition page 185). Écrivons les vecteurs sous la forme il ; 
où u est un nombre et V un vecteur à n—1 coordonnées. Si U, = pe | , les vecteurs Uy = BFUo 
0 

; LA 0 w]= XFuo | _ \kyr =| uo | : 
sont donnés par Uz — | 0 3 Ée = ray | AU}, avec U, — OT} J' En uti 
lisant une norme || |. quelconque, il vient ||Uz{, = [A|*||U{|.. Les vecteurs U{ tendent vers 
ai =uoE: et [U;|. tend vers |[uoE1 ||, =|uol|| E1|., car une norme est continue. En posant 

1 Xe 1 ! À : k L / uo 
ZR= Ur Uf ete=—, on voit que €" Zx=—4—U; tend vers —————E; 
IUk| LAS UE. | LA luol|LE: ||: 


pourvu que w ne soit pas nul. Puisque E est un vecteur propre associé à À, la propriété (ii) 
est vraie dans le cas de notre matrice B particulière et pour une norme quelconque. De plus, 
— | _ 1 k+iry LEE 
RE pi” 7e À 82e = pe, 
Dans le cas général, il existe une base de C” dans laquelle la transformation f : X — AX 
a une matrice B de la forme précédente (page 182) et si P est la matrice de passage, alors 
BF = P-TAFP pour tout entier k > 0. Soient Wo € R° et Uo tel que Wo — PU. Les itérés 
Wx = A*W, et les itérés Uy, = BU sont reliés par la relation Wy, — PU;. Un vecteur propre 
associé à À est la première colonne de P : si l’on suppose que Wo a une coordonnée non 


BZ% 


tend vers |A}, d’où (i]. 
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nulle sur ce vecteur propre, alors la première coordonnée de US est non nulle. Appliquons la 
première partie de la démonstration en choisissant la norme | X |, =||PX|| qui provient du pro- 
duit scalaire (PX').(PY'). Les vecteurs €" Ux tendent vers un vecteur «E1 (où a £0), 


AUx 1x 
1 1 
PUÜz = PUz = P | A tendent vers 
AUX 1l+ AUx fx 


iÉ 
donc les vecteurs X} — Wz = 
I Wx | lPUz|| 


aPE,; : ce vecteur est colinéaire à la première colonne de P, donc c’est un vecteur propre de 
PUz+1= PUx1=PBZ% 


l 1 1 
f pour la valeur propre À. On a AXY% = Wii = 
Wal" PU Url 


donc | AX4| = ||BZ,|. : d’après ce qui précède, [| AX,| tend vers |A]. E 


Remarques sur la convergence 

— Appelons À, ):,...,À, les valeurs propres de À, où |A] > |À;| pour tout i. D’après 
la démonstration, la convergence est d'autant plus rapide que les rapports |A|/|À;] 
sont grands. 


Pour augmenter ces rapports et donc la vitesse de convergence, on peut être amené à 
appliquer la méthode à la matrice A'=A-—al,, où a est convenablement choisi ; en ajou- 
tant à à une valeur propre de À’, on obtient une valeur propre de À (voir exercice 6). 


Quel que soit le signe de À, les vecteurs X»x tendent vers un vecteur propre 
associé à À. 

— Si À est une matrice à coefficients complexes vérifiant les hypothèses que nous 
avons faites pour la proposition, alors (i] reste vrai et si À a pour argument 6, les 
vecteurs (e-?*?)X, tendent vers un vecteur propre associé à À. 

Calcul de la valeur propre de plus petit module. Soit À une matrice inver- 

sible ayant une valeur propre simple y de plus petit module. Aucune valeur propre 

de À n’est nulle, les valeurs propres de A! sont les inverses des valeurs propres 
de À, donc 1/y est la valeur propre de plus grand module de A°!. On peut ainsi 


calculer une approximation de y: en appliquant la méthode à la matrice A1. 


172 - —154 —237 

—161 743 4 2 
mo l-154 477 36 7m|Pnpre 

—237 256 79 37 
nant pour X, le vecteur dont toutes les coordonnées valent 1, on obtient |Y;|| = 
7,999996 ... et les coordonnées de X; sont à peu près (—0,258,0,774, 0,516, 0,258) : 
en fait, la plus grande valeur propre est À = 8 et V = (—1,3,2,1) est un vecteur 
propre associé ; les deux vecteurs (1/||V||)V et X; sont de norme 1 et leur écart est 
de norme inférieure à 1,6107*. 
En appliquant la méthode à A7! on trouve que la valeur propre de À de plus petite 


valeur absolue est y = 1/2, avec vecteur propre W = (1,2, —3,1). 


Exemple. Soit la matrice symétrique À — 


Puisque la matrice À est symétrique, les vecteurs propres relatifs à des valeurs 
propres différentes de À et 4 sont dans le plan orthogonal aux vecteurs V et W 
(énoncé page 216). Choisissons deux vecteurs formant une base de ce plan, par 
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13 13 
exemple U — - et U!— 72 . Si P est la matrice de colonnes V, W,U,U, alors 
0 26 
À _[fD 0 . n_[8 0 en 168 —108 
ona P AP= É a où D = Ë yo] et M = 130 Le Ah Les autres va- 


leurs propres de À sont celles de la matrice M ; elles sont faciles à calculer puisque 
le polynôme caractéristique de M est de degré 2 : on trouve 3/2 et —6/5. 


a Exercices emammmmux 


@ 1. Conditionnement d'une matrice symétrique définie positive. Soit S une matrice symé- 
trique définie positive. Montrer que le conditionnement de S est égal à Umax füinins 
OÙ Umax est la plus grande valeur propre de S et un la plus petite (appliquer la 
proposition page 245). 


@ 2. Localisation des valeurs propres. Soit À — [a;;] une matrice carrée de taille n et soit 
À€ C une valeur propre de À. 


a) Soit u — (ui, u2,...,un) un vecteur propre relatif à À et soit £ un indice tel que 
lux] > [u:| pour tout i. Montrer que l’on a [À — ax] < Di fa: 


b)Si a est un nombre complexe et r un nombre réel positif, posons D(a,r) — 
{2€EC||2-al <r} : c'est le disque de rayon r centré au point d’affixe a. Montrer 
que les valeurs propres de À sont dans la réunion des disques Da je laps) - 


À] < max Le lan!) 


c) En déduire l'inégalité 


î= 


@ 3. Des matrices sympathiques. Soit À — [a;;] une matrice carrée de taille n à diagonale 
strictement dominante et à coefficient diagonaux tous strictement positifs. 


a) Soit À une valeur propre complexe de À. En utilisant l'inégalité obtenue en (a) de 
l'exercice précédent, montrer que la partie réelle de À est strictement positive. 


b) Montrer que si de plus À est symétrique et à coefficients réels, alors À est définie 
positive. 


4. Montrer qu'une matrice carrée À à diagonale strictement dominante possède une dé- 
composition LU (remarquer que les matrices A() sont aussi à diagonale strictement 
dominante et appliquer une proposition page 250). 


5. Reprenons la matrice À = | : 1 de l'exemple page 255 et les vecteurs X% définis 


= fi 1 . 
par Xo — VE | et Xy11 = PA AX%. Calculer les coefficients de X} pour tout 


k > 1 et la limite des vecteurs X}. 
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@ 6. Une méthode itérative pour résoudre certaines équations linéaires. Soient À une matrice 


carrée de taille n et B un vecteur-colonne de K”. On considère le système d'équations 

linéaires (5) : AX = B. 

a) Soit a un nombre non nul. Montrer que X est solution de (S) si et seulement X 
est point fixe de la transformation affine T': Z + (1, — aA)Z + aB. 


On en déduit une technique pour résoudre (S) : chercher un nombre a tel que la 
matrice 1, — aA ait toutes ses valeurs propres de module strictement inférieur à 1. 
S'il en est ainsi, alors pour tout vecteur initial X0, les itérés X1 = T(X0),...,X, = 
T(X5-1),... ont pour limite la solution de (S) (corollaire page 185). 


b) Supposons que toutes les valeurs propres de À sont réelles et comprises entre les 


nombres positifs u et v (où uw < v). Posons a = ne Montrer que les valeurs 
v üu 
propres de la matrice M = I, — a A sont de valeur absolue inférieure à “" <1 


v u 
(les valeurs propres de M sont les nombres 1 — Aa, où À est valeur propre de À). 


3 1/2 0 O0 0 
1/2 3 1/3 0 O0 
c) Application. On prend A = | 0 1/3 3 1/3 0 
0 O0 1/3 3 1/2 
0 O0 0 1/2 3 
( Montrer que les valeurs propres de A sont réelles et comprises entre u = 2,15 
et v — 3,84 (utiliser l'exercice 2.b}). Calculer a. 


{i) Considérons les itérés X1 = T(X0),..., Xp+1 = T(X»),... d’un vecteur X0 € R°. 
Posons B, = AX, et notons 6, = ||X — X,| l'erreur commise en remplaçant 
la solution X de (S) par son approximation X,. Montrer que l’on a 
5, < cond(4)|B—B,|||X,|/1LB,1. 

(ii) Montrer que le conditionnement de À est inférieur ou égal à v/u (remarquer 
que la matrice À est symétrique ; en utilisant (il, montrer qu'elle est définie positive 
et appliquer l'exercice (1). 


(iv) Écrire un algorithme permettant de calculer avec une précision = donnée, les 
coordonnées du vecteur X solution de AX = B. 


[v) Supposons B = (1,0,2,0,1). Montrer que si l’on prend X, = 0, les coordonnées 
de X sont celles de X, à 0,002 près. 
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Chapitre 9 


Limites, dérivées, 
intégrales 


1. Rappels sur les limites 


1.1 Limite d'une suite 

Au chapitre 1, nous avons expliqué pourquoi, dans une suite décroissante de nombres 

positifs, les décimales de ces nombres se stabilisent (page 6). On a la même propriété 

pour une suite décroissante et minorée par un nombre quelconque, ou pour une 

suite croissante majorée. Rappelons quelques définitions : 

- Une suite (u,) est croissante si l’on à uy11 > u, pour tout n. 

- Une suite (u,) est majorée s'il existe un nombre M supérieur ou égal à tous les 
termes de la suite, c'est-à-dire que l’on a u, < M pour tout n. 
Une suite (u,) est minorée s’il existe un nombre m tel que m < u, pour tout n. 

- Une suite (u,) est convergente si elle a une limite finie £ : cela veut dire que pour 
tout nombre € > 0, tous les termes uw, sont, après un certain rang, compris entre 
l—Eetl+e. 

Énonçons les propriétés essentielles des suites monotones. 

— Soit (un) une suite croissante de nombres réels. Si (u,) est majorée, elle est convergente ; 
si (u,) n'est pas majorée, alors u, tend vers +oo. 

— Soit (un) une suite décroissante de nombres réels. Si (u,) est minorée, elle est convergente ; 
si (un) n'est pas minorée, alors u, tend vers —co. 


Suites adjacentes 
Des suites (a,) et (b.) sont dites adjacentes si 
il (an) est croissante et (b,) est décroissante, 
i) An < bn pour tout n, 
ii) b, — an tend vers 0. 
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Dans ce cas, la suite (a,) est majorée par bo, la suite (b,) est minorée par &o, donc la 
suite (a,) a une limite £ et la suite (b,) a une limite {’ ; d’après les théorèmes sur les 
limites, la suite (b, — a,) a pour limite {’ — { et comme par hypothèse b,, — a, tend 
vers 0, on en déduit { = L’; la suite (a,) étant croissante, { est supérieur ou égal à 
tous les a, et de même, L’ est inférieur ou égal à tous les b,. 


Des suites adjacentes (a,) et (b,) ont la même 
limite Let l'on a ay << b, pour tous n et p. 


Puisque l'écart entre a, et b; tend vers 0, ces nombres permettent d’encadrer la 
limite { avec la précision qu’on veut. 


Suites itératives 
Nous avons déjà rencontré des suites (u,) formées des itérés d’un nombre initial uw 
par une transformation f : on a par définition 


Uni1 = f(un), pour tout n > 0. 
Faisons deux hypothèses sur la fonction f. 
Hypothèse (a) : f a un point fixe p, c'est-à-dire tel que f(p) = p. 
Pour visualiser le comportement des u,, on peut procéder comme page 15 : sur un 
même dessin, représentons le graphe de y= f(x) et la droite d’équation y=—x ; ces deux 


graphes se coupent donc au point À = (p,p). Construisons une ligne brisée comme 
ci-dessous, en joignant successivement les points (uo,u1), (u1,u1), (u1,u2), (uo,u2), etc: 


figure 1 


Hypothèse (b) : Au voisinage du point À, le graphe 
de f reste dans le cône (partie grisée de la figure 3) 
formé de deux droites sécantes en À de pente +k, 
où k est un nombre tel que 0 < k < 1. 


Si M = (x,y) est un point du cône, la pente du seg- 
ment AM est comprise entre —k et k, autrement dit 
[y — p| < klx — pl. 

Si x est l’abscisse d’un point du cône, alors le point 
(x, f(æ)) est dans le cône et donc | f(x) —p| < k|x — pl. 
Puisque k < 1, il en résulte que f(x) est plus proche 
de p que x; en particulier, f(x) est aussi l’abscisse d’un point du cône. 


8 Y 


figure 3 
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Définition 
Si les hypothèses (a) et (b] sont vérifiées, on dit que f est contractante au voisinage 
du point fixe A. Le nombre k < 1 s'appelle le coefficient de contraction. 


Si la valeur initiale w, de la suite est l’abscisse d’un point du cône, alors le point 
Mo = (uo, ui) est dans le cône, donc aussi le point Mi = (ui, u2) et de proche en 
proche, tous les points M,, = (u,,un+:1) sont dans le cône. On a donc 


fun+1 — pl < klun — pl, pour tout n > 0 
Il s'ensuit 


(x) lun — pl < klun-1 — p] < Elus — p| < +. < k"|uo — p| 


Puisqu'on a supposé 0 < k < 1, k" tend vers O0 quand n tend vers l'infini, donc 
lun — p| tend vers 0, autrement dit u, tend vers p. 


Si f est contractante au voisinage du point fixe p et si uo est assez proche 
de p, alors la suite définie par un+1 = f(un) a pour limite p. 


On dit que le point fixe p est attractif. Les inégalités (+) montrent que la convergence 
est d'autant plus rapide que le coefficient de contraction k est plus petit. 


Exemple. Une pompe de volume v permet d'envoyer de l’air dans une enceinte de 
volume V par un tuyau d'alimentation de petit volume u. On suppose que la com- 
pression est isotherme. Quelle est la pression dans l'enceinte après n coups de pompe ? 
La pompe est à la pression extérieure PF, qui est aussi la pres- 
sion initiale dans l'enceinte. Supposons qu’on a obtenu une 
pression P dans l'enceinte et donnons un coup de pompe. La 
valve s'ouvre lorsque la pompe exerce une pression P, le vo- 
lume d'air dans celle-ci étant passé de v à une valeur 1 < v. 
Le produit de la pression par le volume est constant, donc 
Pi(v+u) = P(u1+u). Quand le piston arrive en fin de course, 
le volume vi+u+V a été comprimé en u+V et la pression 
dans l’enceinte et le tuyau prend la valeur P' telle que P(wi +u+V) = P'(V +u). 
Ainsi on a P'(V +u) = P(u +u) + PV = Py(v+u) + PV. En notant P, la pression 
dans l'enceinte après n coups de pompe, il vient la relation 


Pa Pa + LEUR 


V v+Uu 
Via ya 


La fonction affine f:xt+ PF, a un point fixe p : 


V v+Uu ax v+Uu 
= P,, d = ——— P,. 
F Fou Via : EME & 


— Le graphe de f est la droite de pente k = = < 1 passant par le point (p,p) : 
l'hypothèse [b) est donc satisfaite. 
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v+Uu 


On en déduit que P, tend vers la pression limite Po, valeur d'autant plus 


grande que le volume « du raccord est petit. 


1.2 Limite d'une fonction 


On a les mêmes propriétés que pour les suites. Rappelons qu’une fonction f à va- 
leurs réelles est majorée s’il existe un nombre M tel que f(x) < M pour tout x. Une 
fonction f est minorée s'il existe un nombre m tel que f(x) > m pour tout x. 

Soit f une fonction définie sur un intervalle ]a,b[; a et b sont des nombres ou bien 
l’un des symboles —o ou +00. 


- Si f est croissante et majorée, alors f(x) a une limite finie quand x tend vers b; 
si f est croissante et non majorée, alors lim f(æ) = +co. 
T— 


- Si f est croissante et minorée, alors f(x) a une limite finie quand x tend vers a; 
si f est croissante et non minorée, alors lim f(x) = —0o. 
T—a 


Une fonction décroissante minorée a une limite finie quand x tend vers b; si f est 
décroissante non minorée, alors f(x) tend vers —oo quand x tend vers b. 

Voici les propriétés générales du calcul des limites; nous les formulons pour les 
fonctions, mais elles sont valables aussi bien pour des suites de nombres. x, désigne 
un nombre ou bien l’un des symboles +oo ou —co. 

Supposons que f(x) et g(x) ont une limite finie quand x tend vers x. 


= lim [/(e) + g(0)] = Jim /(e)+ Jim (a) et lim [f(a)g(e)] = [lim F(x)] [lim (x) 


T— T0 
e lim f(x) 
Si lim g(x) 0, alors lim = 
Cr zx g(x) lim g(x) 
T—tO 
Si f(x) tend vers + ou vers — quand x tend vers x9, alors lim FE = 0. 
TT T 


Ordres de grandeur 


On a souvent besoin de comparer les ordres de grandeur de deux quantités qui 
tendent simultanément vers 0 ou vers l'infini. Dans ce but, nous allons définir la 
notion de quantité négligeable devant une autre et de quantités équivalentes. 

Chacune des fonctions x, x? ou x” tend vers 0 quand x tend vers 0, mais avec des 
ordres de grandeur différents : par exemple, pour # proche de 0, x"*! est très petit 
devant x” puisque x"*l/x"=x tend vers 0. Ces fonctions puissances servent d'échelle 


de comparaison pour mesurer l’ordre de grandeur d’une quantité qui tend vers 0. 


2.1 Exemples 


Posons f(x) =tanx—sinx. Puisque sinx et tanx tendent vers 0 quand x tend vers 
0, il en va de même de leur différence f(x). Pour comparer f(x) aux quantités x, x?, 
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et calculons 


xŸ pour de petites valeurs de x, formons les rapports _ ; fG) : JG) 
va A 


leurs valeurs pour x = 101,10 2,10-%,10-* avec une précision relative de 1/1000. 


x 107! 107? 107 107 


f@) 0140), 510% | 540 7. | 5.107 
fG) BOEU | He SI0)| SD 
LT 

) 0,501 0,5 0,5 0,5 
HA 

F@) | on 50 500 5000 
4 ? 

HA 


Les deux premières lignes du tableau montrent que pour x petit, f(x) est négligeable 


J(x) 


devant x et devant x? ; la troisième ligne indique que —- semble tendre vers 1/2 : 
a 


cela veut dire que pour x assez petit, f(x) est de l’ordre de grandeur de (1/2)x* : 
on dit que les quantités f(x) et (1/2)r° sont des infiniments petits équivalents. 
Faisons des calculs analogues pour la différence g(x) =tanzx—(sinx)? qui tend aussi 
vers 0 quand x tend vers 0. 


ge) 0,903 | 0,990 | 0,999 | 0,9999 
2 @) 903 | 99,0 | 999 | 9999 
D 


g(x) 


Cette fois, ——" semble tendre vers 1, donc g(x) est de l’ordre de x quand x tend 
PA 


vers 0 : on dit que g(x) est un infiniment petit équivalent à x. 


2.2 Infiniments petits, infiniments grands 


Soient uw et v des fonctions définies sur un même intervalle Z et soit a un nombre 
appartenant à 1 ou bien une extrémité de Z (éventuellement +oo ou —0o) 


Définitions 

Si _ tend vers 0 quand x tend vers a, on dit que u(x) est infiniment petit, ou né- 
gligeable, devant devant v(x) quand x tend vers a, ce que l’on note u(x) & v(x). 
On dit aussi que v(x) est infiniment grand devant u(x), ce qui se note dla) Sato). 

Si _. tend vers 1 quand x tend vers a, on dit que u(x) et v(x) sont dns 


quand x tend vers a, ce qui se note u(x) = v(x). 
T—a 
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Propriétés de ces relations 


lux) & 1 si et seulement si u(x) tend vers O0 quand x tend vers à. 


T—a 
2) Si u(x) = v(x) et si v(x) a une limite (éventuellement infinie) quand x tend vers a, 
T—a 
alors u(x) a la même limite. 
3) Si L est un nombre non nul, alors u(x) + £ si et seulement si u(x) tend vers { quand 
T—a 


x tend vers a. 


4) Si u(x) + v(x), alors u(x) et v(x) ont le même signe pour x assez proche de a. 


Sju(x) + v(x) si et seulement si [u(x)—v(x)] & v(x). 


@) € v À u(æ), alors u(e) € 

7) Si u(x) pus v(x) et si v(x) pus w(x), alors u(x) a w(x) 
Si u(x) ee. v(x) et si v(x) < w(x), alors u(x) « w(x) 

8) Si u(x) ns v(x) et si w(x ee h(x), alors u(x)w(x) es v(x)h(x) 
Si u(x) _ v(x) et si w(x) & h(x), alors u(x)w(x) & v(x)h(x) 


Démonstration. La propriété u(x) 1 veut dire que u(x)= 2 tend vers 0 quand x tend 


ue v(x) et lim Re 
v(x) æ—a V(T 
même limite, ce qui montre (2. La propriété (3) vient de ce que si {£0, u(x) tend vers L si et seule- 


vers a. Supposons u(x) — v(x). On a u(x)= =1, donc u(x) et v(x) ont la 


. U(x) 
ment si 


tend vers 1. Si u(x) et vu(x) sont équivalents quand x tend vers a, u(x)/v(x) tend 


vers 1 ; alors pour x assez proche de a, le rapport u(x)/v(x) est positif, donc u(x) et u(x) sont 
u(x) — v(x) _ u(x) u(x) 
v(x) u(x) u(x) 


tend vers 0. La propriété (6) affirme simplement que si chacun des rap- 
Le u(x) 


v(æ)  w(x) w(x) 
se démontrent de même en utilisant que la limite d’un produit est égale au produit des limites. ml 


de même signe. Montrons (5) : puisque tend vers 1 si et 


u(x) — v(x) 
u(x) 
u(x)  v(x) 


1, le rapport 


seulement si 


ports 


tend vers 0, leur produit 


tend vers 0. Les quatre dernières propriétés 


Exemples 


On a (tanx-sinx) « x? et (tanx—sinx) E (1/2)x°, 
x— &— 
— [tanz-(sinx)?] + x. 
x—0 
— Puisque x° « ?, la propriété (5) montre que x? + x° a . 
LE z— 
De même, a?+ (tan x— sin x) _ x?, car tanx—sinx est infiniment petit devant x?. 


T— 


- On sait que ŸT et anZ tendent vers 1 quand x tend vers 0, donc sinz = x 
T T— 
et tanx à x. Cependant, la différence tan x — sin x, infiniment petite devant x, 


æ—0 


n'est pas équivalente à x. 
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-Onaz «& et Vr € x. 


T—+00 T—+00 


En effet, x/x°? = 1/x et /x/x = 1//x tendent vers 0 quand x tend vers +00. 


Proposition. Soit une fonction polynôme P(x) = apx? + april +... +a,x", avec 
p<n, a Z0 et an 0. Alors on a P(x) due ei Pie) #6 die. 


T— T— TOO 


2.3 Fonctions usuelles 


Les fonctions puissances 

Soit n un entier strictement positif. 

La fonction puissance x+-- x" est définie sur R et l’on a lim x"=0, lim z°—+0. 
T— 


T—+00 


nm 


-— Rappelons que si x Æ 0, on pose x" = 1/x" : la fonction x + x" est définie sur 


R\{0}. On a Em (x) = +oo et lim (x?) = 0. 


Les fonctions racines 

La fonction racine n-ième, notée x ++ {/x où x x!/", est définie sur [0,+oo[. Par 
définition, on a les relations ( {/x)" = x — {/x", ce qui veut dire que les fonctions 
x x et x x" sont des bijections réciproques sur [0,+oo|. 

Les limites aux bornes de l'intervalle sont lim {x = 0 et im VT = +00. 


æ—0*T 


La fonction logarithme 


La fonction logarithme, notée x + Inx, est définie sur ]0,+c[. Elle est croissante 
et non majorée, donc lim Inx— +00. Quand x tend vers O0 par valeurs positives, 


æ—+00 


1/x tend vers l'infini, donc Inx — —In(1/x) tend vers —co. 


Propriétés du logarithme 

a)n1=0,(nr>0x>1), (nr <00<x<1), ne=1. 
b}In(xy) =Inx+lny, In(x") =nlnx et In(x!/*) = (1/n)inx. 

a nc) = 1/5: 


d) lim MZ 20et lim (x mx) = 0. 
T—+00 æ—0+ 
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La dernière propriété reste vraie si on élève Inx ou x à des puissances positives : 


si pet r sont des exposants positifs, alors (nx)? < x" et x'(Inx)} € 1 
æ—+00 æ—0* 


; In(x'/P 
En effet, u(x) — he Ê ed Par 
x7/P x7/P y 
ny 


puisque DE tend vers 0, u(x) aussi. Quand x tend vers O0 par valeurs positives, 


z=1/x tend vers +co, donc (Inz)?/z" tend vers 0 d’après ce qu’on vient de montrer; 


, où y=x"/P tend vers l'infini avec x; 


comme on a Inz=/|lnx|, il vient (Inz)?/z" = x'|Inx|?, donc lim [z"(nx}?] = 0. 


La fonction exponentielle 


La fonction exponentielle, notée x+-- expzx ou z+- e”, est définie sur R. C'est la bijec- 
tion réciproque du logarithme, donc on a In(expx) = x pour tout x et exp(Inx) = x 
pour tout x > 0. La fonction exponentielle est croissante et non majorée, donc 
T 


lim ef = +00. Puisque e * = 1/e”, on en déduit lim e° = 0. 


T—+00 T——00 


Propriétés de l'exponentielle. On les montre en prenant le logarithme. 


sil, s ls rs 0 .0t<é<lés »5< 0) 
b) ettY = eteY , ent — (an et eT/n _ (erjie, 
c)exp'(x) = exp x. 


d) Pour tout r > 0, on a lim (e®/x") = +oo et lim (|r/"e*) = 0. 


On en déduit que pour tout entier n,onax" <& e’ete® < 1/x". 
T—+00 æ—>+00 


8Y 


Fonctions hyperboliques 
e+e * 
2 
e°— 


On pose : chx— : c’est La fonction cosinus hyperbolique, 


sh x — €: c'est la fonction sinus hyperbolique. 


La fonction ch est paire et la fonction sh est impaire. 


-Ona (chx)?—(shx}?=1 , ch'x=shx et shz=chx pour tout x. 
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sh’ ch’ 
1 
> 
T T 
graphe du graphe du 


cosinus hyperbolique sinus hyperbolique 


Fonctions puissances généralisées 


Si n est un entier, on a +” —exp(nlnx) pour tout x > 0. L'expression exp(nlnx) 
a encore un sens si l’on remplace l’entier n par n'importe quel nombre réel à : cela 
permet de formuler la définition suivante de la puissance a-ième d’un nombre x > 0. 


Définition 
Soit « un nombre réel. Pour tout x > 0, on pose x°* = exp(alnx). La fonction 
æt+ x° s'appelle une fonction puissance. 


Comme avec des exposants entiers, on a les règles de calcul : 
pourz>0ety>0, (zy)*=xyt, at = mem , (2%)8 = 2% et à° = 1. 
Voici une propriété utile dont la vérification est immédiate. 


Si u(x) et v(x) sont positifs et si u(x) + u(x), alors [u(x)] Tan [u(x) | me 


T—a 


2.4 Échelles de comparaison 


Une échelle de comparaison quand x tend vers + 


T—s 


On a toujours x" /x° = x"7%; si r < s, l’exposant r—s est négatif, donc x”/x° tend 
vers 0 quand x tend vers l'infini : 


sir <8,alors x" << x. 
æÆ—+00 


Puisqu'on a x" < e*etlnxr < x" pour r >0, on en déduit le classement suivant. 


æ—+00 æ—+00 


l/n 1/2 


KT ErEr <<< e 
Toutes ces quantités sont infiniment grandes quand x tend vers +co, mais chacune 
est infiniment petite devant la suivante. 

En prenant les inverses, on obtient une échelle d’infiniments petits, c’est-à-dire de 
quantités tendant vers 0 quand x tend vers +oo. 


Quand x — +00 LEE RE ELEIE TL E..< nee) 
; TL É sh 


Vz Yx nz 


Quand x — +o : nr &#x 
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Une échelle de comparaison quand x tend vers 0 


Sir>s,x'/x°=x" "% tend vers 0 quand x tend vers 0, donc x” est infiniment petit 
devant x°. Nous avons montré que x” Inx tend toujours vers Ü quand x tend vers 
0, donc x” est infiniment petit devant 1/Inx. On en déduit une échelle d’infiniments 
petits quand x tend vers 0 par valeurs positives. 


Quand x — 0 gas erenltenfte.. cute «el 
nt 


En prenant les inverses, on obtient une échelle d’infiniments grands, c’est-à-dire de 
quantités tendant vers +00 quand x tend vers O0 par valeurs positives. 


Quand x — 0 :1<l/Inel & LE << 1 ele se L 


21/7 Vz x x x° 


Exemple. Quel est l’ordre de grandeur de [1°—9x + 10]!//? quand x tend vers 2? 
On a x°—9x+10—(r—2)(x?+2x7-5) et lim (2°+27—5)=3, donc (r%—9x+10) < 3(x—2). 


2 
On en déduit [r$—9x + 10] Lu , V3 Vx—2. 
2 


> 

Définition 

Soit f une fonction. Si l’on a f(x) = u(x—a), où u une fonction de comparaison 
T—a 

en 0, ou un produit de telles fonctions, on dit que u(x—a) est la partie principale 


de f(x) quand x tend vers a. De même, si f(x) ” u(x), alors v(x) est la 


partie principale de f(x) quand x tend vers +00. 


Croissance exponentielle et factorielle pour les suites 
Soit a un nombre réel tel que a > 1. 


a" tend vers +oo quand n tend vers +oo et pour tout nombre a, on a a > n°. 
n—+00 


En effet, puisque Ina > 0, a" = e"®4 est infiniment grand devant toute puissance de 


n, quand n tend vers +00. 


Nous allons montrer n! est infiniment grand devant a” quand n tend vers +oo et 
donner un équivalent utile de n!. 


Pour tout nombre a>1l,ona nl > a” 
n— +00 


- formule de Stirling : n! = n'e-"V27rn 
n— +00 
Choisissons un entier N > 2a. Pour tout entier n=N+p,ona 


a” a a a a 


nm ONN+IN+2 N+p 


a Repas , à a” aN 1] 
- est inférieur à < ' 
N +i N n! N! 2P 


vers l'infini, p aussi, donc 1/2P tend vers 0 et a” /n! également. 


Quand n tend 


Chacun des rapports < ;, donc 
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3. La dérivée 
3.1 Définition de la dérivée 


Soit f une fonction définie sur un intervalle Z et soit a un nombre qui est dans 1 
ou bien qui est une extrémité de J. 


Définition 


| (x) — f(a) 
Si le rapport Des 


a une limite finie quand x tend vers a, cette limite 


s'appelle la dérivée de f en a et se note f”(a). 


Sur le graphe de f, plaçons le point À d’abscisse a 
et un point M d'abscisse x £ a. Le segment de droite 


AM a pour pente a La dérivée de f en a, si 


elle existe, est par définition la limite des pentes de ces 
segments AM quand le point M du graphe tend vers A. 


Le nombre f'(a) est la pente de la tangente en À au graphe de f. 
L'équation de la tangente en A est : y — f(a) = f'(a)(x — a). 
La différence f(x) — f(a) est l'accroissement des valeurs de la fonction entre a et x : 


la dérivée en a permet ainsi de comparer, du point de vue de l’ordre de grandeur, 
l'accroissement de la fonction et l'accroissement de la variable au voisinage de a. 


Si f'(a) 0, alors [f(x) — f(a)] +, f'(a)(— a). 


(sin x)? 


Exemple. Calculons la partie principale de f(x) = + 
—€ 


quand x tend vers 0 


(a est un nombre différent de 0). 


ax ax 


On a sinx = æ et comme la dérivée en 0 de 1—e ** est à, il vient 1—e me ax. 
T— z— 


2 
On en déduit que f(x) est équivalent à © — Ÿ* quand x tend vers 0. 
ax a 
Proposition. Pour qu'un nombre k soit la dérivée de f en a, il faut et il suffit que 
l'on puisse écrire f(x) = f(a) + k(x — a) + (x), où px) € (x — a). 
Je) FO 4 2 8@). one 1-10 
T—a T—Q T—a 


(x) 


quand x tend vers a si et seulement si Le tend vers 0. = 
T—a 


Démonstration. On a en effet tend vers k 


Approximation affine en un point 


Supposons que f est une fonction dérivable en a. Par définition, on a donc 


La) = S(a) + F'a)(e — à) + pla), où pla) € (x a). 
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Pour des valeurs de x assez proches de a, la fonction affine x f(a) + f'(a)(x — a) 
est une approximation de la fonction f à condition de considérer comme négligeable 
la différence (x) infiniment petite devant x — à. 


Définition 
L'application affine T, :x+ f(a) + f'(a)(x — a) s'appelle l'approximation affine de 
J au point a. 


Le graphe de T, a pour équation y= f(a)+ f'(a)(x — a) : 
le graphe de l’approximation affine de f au 
point a est la tangente en a au graphe de f. 


- Sur la figure, l’ordonnée de P est f(a), celle de Q est 
T,(x), donc PQ = f'(a)(x—a). 

— La distance QR est négligeable devant |r—a| pour x 
assez proche de a. 


3.2 Calcul des dérivées 


Rappelons les règles pour calculer une dérivée ainsi que les dérivées à connaître. 


uv — uv! 


V2 


— dérivée d'une composée : (fo u)'(x) = f'[u(x)]u'(x). 


! 
—(u+v) =u+v,(uv) =uv+uv, (2) = 


 exp'(x) = expzx et In’(x) = 1/x. 
- La dérivée de la fonction x + x° est ar®-! pour tout x > 0. 

1 
(cos x) 


 sin/(x) = cosx, cos'(x) = —sinx et tan/(x) — 1+ (tanx)? — si 
Vérifions que la fonction f(x) =x1* se dérive bien comme une fonction puissance entière. 
Par définition, on a f(x) = explu(x)], où u(x) = alnx. D’après la règle pour dériver 
une composée, il vient donc 


f'(æ)=exp'[u(x)]u/(x)=explu(x)] S=aexp{alnr|exp| Inr|=aexp[(a-1)Inr|=ax**. 


Exemples d'approximations affines 
Dans les formules ci-dessous, w(x) désigne des quantités infiniment petites devant 
x quand x tend vers 0, autrement dit w(x) «, z. 
T—+ 
= (1+x)*=1+ax+v(x) pour tout nombre à positif ou négatif, 
et —=l+x+o(x) et In(l+x)=x+v(x) 
- sntr=x+o(x) , cosx—=1l+v(x) et tanx =x+o(x). 
En effet, les fonctions e”°, In(1+x), sinx et tanx ont pour dérivée 1 en x = 0, la dérivée 
en 0 de (1+x)* est à et cos’/(0) = —sin0 = 0. 


Pour uw assez petit, le sinus d’un angle de x degrés est équivalent à en 
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Exemple. Considérons un carré de côté a qu’on déforme en un rectangle en 


allongeant très légèrement deux côtés opposés : comment varie la diagonale ? 


La diagonale du carré est Va? + a? — aV2 et celle du rectangle est 


— TL — 

f(x) = Va? ++? en appelant x la longueur du grand côté du rec- | NQ 
IN 

<— À —>- 


tangle. On a f(x) = ——*—, donc l’approximation affine de f en 


Va? +? 
a est f(a) + f'(a)(x—a) = V2a? + 


a 
2a? 
petit allongement {= x — a du côté, la diagonale du carré s’allongera d'environ {/V2. 


z—a = av2+ 12€, Pour un 


3.3 Comportement d'une fonction au voisinage d'un point 


Une fonction f a un maximum local au point a si pour tout x assez proche de a, 
f(x) est inférieur ou égal à f(a). De même, f a un minimum local en a si l’on a 


f(x) > f(a) pour tout x assez proche de a. 


Proposition. Si f est dérivable en a et si f a un maximum ou un minimum local en 


a, alors f'(a) = 0. 


La proposition signifie qu’en un point où f a un maximum ou 
un minimum local, la tangente est horizontale, à condition que 


f soit dérivable en ce point. œ 


Démonstration. Si f’(a) Z 0, on sait que f(x) — f(a) a le signe de f’(a)(x — a) pour tout 
æ assez proche de a. Puisque x — a change de signe en a, c’est que la différence f(x) — f(a) 
ne garde pas un signe constant autour de a. Cela montre que si f'(a) 0, alors f n’a pas 


d’extremum local en a. = 


La condition f'(a) = 0 n’entraîne pas que f a un maximum ou un minimum local : 
ainsi la dérivée de x + x° est nulle en x — 0, mais cette fonction n’a pas d’extremum 


en 0 comme le montre le graphe page 267. 


Formulons encore deux propriétés utiles. 


— Si f'(a) = 0, alors [f(x) — f(a)] € (x — a). 


T—a 


Si lim 1) = fG) _ 
T—a LE —@ 


Loo, alors | f(x) — f(a)| > Îx — al. 
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Exemples. Voici trois fonctions u, v, w qui tendent vers 0 quand x tend vers 0 


mais qui se comportent bien différemment au voisinage de 0 : 


y À 


> 
T 


u(x) = Va 


graphes de u, v et w 


— La fonction u(x) = /x n’est pas dérivable en 0, car le rapport /x/x =1//x tend 


vers +oo quand x tend vers 0 par valeurs positives : on a u(x) > x, autrement 
æ—0*+ 


dit, au voisinage de l’origine, l'accroissement de la fonction est infiniment grand 
devant celui de la variable. Intuitivement, la pente de la tangente à l’origine est 
infinie, ce qui signifie qu’à l’origine, le graphe est tangent à l’axe des ordonnées. 


Pour la fonction v(x) = 2x — x°, la tangente à l’origine a pour pente v'(0) = 2 : 


on a donc v(x) de 2%. 
%—) 


En 0, la fonction w(x) = x? a pour dérivée w’/(0) —0 : le graphe de w est tangent 


à l’axe des abscisses. On a w(x) x et quand x tend vers 0, l’accroissement de 
æ—0 


la fonction est infiniment petit devant celui de la variable. 


Un comportement comme celui de # ou de w ne se produit qu’en des points exception- 
nels : lorsqu'une courbe dérivable coupe l'axe des abscisses, il y a en général au point 


d'intersection une tangente de pente finie non nulle. 


Par exemple, perturbons un peu les fonctions « et w en leur soustrayant un petit nombre 
€ > 0. Les graphes des fonctions u-(x) = u(x) —e et w.(x) = w(x) —E s’obtiennent à 


partir des graphes ci-dessus en remontant de € l’axe des abscisses. 


y y 
T pi T ve 


T T 


y= Var -E y=9xz-2 —Ee y= 2 — € 

graphes de u., v: et we 
Cette fois, le graphe de u: coupe l'axe des abscisses en un point à tangente T' de pente 
finie non nulle et il en va de même pour le graphe de w.. Cette propriété était vraie 


pour vw et elle reste vraie pour w.(x) = v(x) — €. 
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Exemples. Voici les graphes de la fonction (sinx})? et de la fonction sin(x?) : 


2 


- Puisque (sinx)? a pour dérivée 2sinxcosx, le graphe de (sinx)? est tangent à 
l'axe des x en tout point kr, où le sinus s’annule. Le maximum est atteint aux 
points (x/2)+kT, où sin x = +1. La fonction est périodique de période 7, car 


sm(æ+T) = —sinx, donc (sin(x+r))” = (Sins), 

- Pour le graphe de sin(x?), on a sin(x?) < x? quand x tend vers 0, d’où la forme 
parabolique au voisinage de l’origine. Les oscillations sont de plus en plus rapides 
au fur et à mesure qu’on s'éloigne de l’origine : en effet, sin(x?) s’annule aux 


points x, = +Vkr, où k € N, et entre deux zéros consécutifs, l'écart 


leu — cel = Vk+ Dr — Vkr = om 


décroît en tendant vers (0. 


3.4 Graphes du carré et de la racine carrée d'une fonction 


Supposons qu’on connaisse le graphe d’une fonction dérivable f et qu’on veuille 
dessiner rapidement l'allure des fonctions 4/f(x) et [f (x)|°. 


Le domaine de définition de 4/ f(x) est formé des nombres x tels que f(x) > 0 : ils 
correspondent aux points du graphe de f situés au dessus de l’axe des abscisses. 


Règles à suivre pour dessiner ces graphes 
1} Les fonctions 4/ f(x) et [f(x)]° s'annulent exactement aux mêmes points que f. 


2) Sur tout intervalle où f est positif ou nul, les fonctions \/ f(x) et [f(x)l° varient dans 
le même sens que f. 


Si par exemple on a 0 < f(x) < f(y), alors Vf{x) < Vf{y) et HOIR < HOIR 


3) Sur un intervalle où f(x) < 0, les variations de FOIE sont opposées à celles de f. 
4) Si le graphe de f coupe l'axe des abscisses avec une tangente de pente non nulle, alors 
en ce point le graphe de \/ f(x) a une tangente verticale. 
5) Si le graphe de f coupe l'axe des abscisses avec une tangente non verticale, alors en ce 
point, le graphe de [f(x] est tangent à l'axe des abscisses. 
En notant a ce point, on a f(a) =0 et si par exemple f'(a) >0, f(x) est positif pour 
x > à assez voisin de a : f(x) est donc défini sur un petit intervalle J = Ja, v|. 
f®) 1 J@) On en déduit que si le rapport f@) 


z—a f(x) *—4 x—a 
f(x) 
a une limite non nulle quand x tend vers a, alors 


Pour x€ J,on a 


tend vers l'infini, car 
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Jim 1/4/f(x) = +00 : cela veut dire que le graphe de 4/f(x) a une tangente verticale 
en a. La dérivée de HOIR au point a est 2f(a)f'(a) =0 puisque f(a) = 0 : le 


graphe de [f (x)]° est donc tangent en a à l'axe des abscisses. 


6} Si C2 “. æ?, alors quand x tend vers +0, le graphe de \/ f(x) a pour direction 
x nptetque T axe des abscisses. 
Il suffit de Ver que si f(x)/x? tend vers 0 quand x tend vers +00, alors 
V/f(x)/x = /f(x)/x? tend aussi vers 0. 
7)Si f(x) > x, alors quand x tend vers +, le graphe de [f(x)] a pour direction 
æ—+00 


asymptotique l'axe des ordonnées. 


Remarque 

Si le graphe de f est tangent à l'axe des abscisses en un point 4, on ne peut rien en dé- 
duire sur le comportement de ,/ f(x) au voisinage de a. Ainsi les fonctions f(x) =x?, 
f(x) = 4x? et f(x) — 4x sont tangentes à l’axe des x à l’origine, mais en ce point 


fi(æ) = |x| a deux demi-tangentes de pente 1 et —-1; 
. | — 2|x| a deux-demi tangentes de pente 2 et —2; 


— 2x? est tangente à l’axe des . 


VV TVR VV 
allure de 
fi, fe, fs 
7 % T 


Un exemple. Dessinons la courbe d’équation y? = 0,7 +cosx, où —-T<x<rT. 


Posons f(æ)=0,7+cosx. Puisque sn ES de la courbe est y=+,/ f(x), commençons 


par dessiner le graphe de la fonction 4/ f(x) = 0,7 + cos x entre —r et 7. 
Il y a un nombre à € ]0,7| tel que cos a = . (a est peu différent de 2,34). On a 


f(Ha) = 0. Puisqu’on a cosx > cos a si —a <x <a, f prend y 

des valeurs positives ou nulles sur [-—a, a] : c’est l'intervalle de 

définition de 4/f(x). z 
Sur [0,a|, f décroft de 1,7 à 0 ; comme f est paire, on en déduit "® l ® 
qu'elle est croissante sur [-—a, 0]. graphe de f(x) 
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Quand x va de —a à 0, 4/f(x) croît de 0 à 4/1,7; quand x y 
va de 0 à à, 4/f(x) décroît de /T,7 à 0. 
D 


— On a f(x) = —-sinx donc au point à, le graphe de f a une 


— «a | a T 
tangente de pente — sin & £ 0. Par conséquent, ,/ f(x) a une _— 
2. en en @, : même en . 0e Et à LE 

Pour dessiner la courbe d’équation y? = 0,7 +cosx entre —r et + 
ñ, il suffit de compléter le graphe de /f(x) par symétrie par 
rapport à l’axe des abscisses. On trouve ainsi une courbe fermée 1% 


et symétrique par rapport à chacun des axes. 


3.5 Les fonctions trigonométriques réciproques 


La fonction Arc sinus 
La fonction x sinx définit une bijection croissante [—x/2,7/2] — [-1,1] : pour 
tout nombre y € [-1,1|, il existe un unique nombre x € [-x/2,7/2] tel que y =sinx. 


Définition 
Pour tout yE€ [1,1], on note Arcsiny le nombre x € [—7/2,x/2] tel que y=sinx ; 
ce nombre s'appelle l'Arc sinus de y. La fonction y Arcsiny est une bijection 
croissante et impaire de [—1,1] sur [-x/2,7/2]. 
On a Arcsin0 = 0, Arcsin L = T, Arcsin v? = T, Arcsin v3 = T'et Arcsin1 = T. 
2 6 2 4 2 3 2 
Pour dériver f(y) = Arcsiny, écrivons que pour tout y E]-1,1{, on a l'identité 
sin(f(y)) = y et dérivons en appliquant la règle pour une fonction composée. Il vient 
[cos( f(y))] f'(y) = 1. Puisqu'on a supposé y strictement compris entre —1 et 1, le 
nombre + = f(y) est dans l'intervalle ouvert ]-7/2,7/2|, donc cosx > 0. Ainsi on a 


cos æ = /1— (sinx)? = 4/1 — 2, car sinx = y, et il vient 
Arcsin'(y) = _— , pour tout y E ]-1,1[. 
1-7 
La fonction Arc tangente 
La fonction ++ tan x définit une bijection croissante |—7/2,7/2[ — |—-c0,+c0| : pour 
tout nombre réel y, il existe un unique nombre x € ]-x/2,x/2| tel que y = tan x. 


Définition 

Pour tout y€ R, on note Arctany le nombre x € ]-x/2,x/2] tel que y =tanx; 
ce nombre s'appelle l’Arc tangente de y. La fonction y+- Arctany est une bijection 
croissante et impaire de R sur ]—-7/2,7/2|. 


On a Arctan0 —0, Arctan1 = x/4 et lim (Arctanx) = 7/2. 
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Pour dériver g(y) = Arctany, écrivons que pour tout y, on a tan(g(y)) = y : on obtient 
[tan’ (g{y))]g'(y) = 1. Posons x = g(y), de sorte que tanx = y. On a 
tan/(x) = 1+(tanx)? = 1+%, 


d'où (1+y°)g'(y) = 1. 1 


Arctan'(y) = —-—, pour tout yER. 
1+% 
7 
Arctanx 
Ésse —7/2 Denis sun T2 


3.6 La différentielle 


Supposons que f est une fonction dérivable en a. Par définition, l'accroissement 
f(x) — f(a) est alors approché par f'(a)(x — a), avec une erreur infiniment petite 
devant æ—a. 


Définition 
La différentielle en a de la fonction y = f(x) est la fonction linéaire t+ f'(a)t. On 
note dx la variable et dy la valeur de la différentielle, de sorte qu’on a dy= f'(a)dx. 


2e ‘ . d 
La dérivée de f au point a se note aussi D — f'(a). 
TL 


Si l’on donne à la variable dx une valeur numérique assez petite dx, alors ôy= f'(a)ôx 
est une bonne approximation de l'accroissement f(a + ôx) — f(a) des valeurs de la 
fonction. Traduisons le calcul des dérivées en un calcul des différentielles. 

Soient y — f(x) et z — g(x) des fonctions dérivables d’une même variable x. 
Somme : d(y + z) — dy + dz. 

Produit par une constante : Si k est une constante, alors d(ky) — k dy. 

Produit : d(yz) — (dy)z + y(dz). 
Quotient : Aux points où z £ 0, d [2] = _ 


Composée : Si v — g(y) et y = f(x), alors du = g'(y)dy = g'(y)f'(x)dx, ou encore 


y 
5 AZ. 


dv dv dy : ND h 
= = — — (règle de différentiation en chaîne) 
dx dy dx 8 jh 
C'est la formule pour dériver la fonction composée go f : a = (go f)'(x) = g'(y)f'(x). 


Fonctions réciproques l'une de l'autre : Si des quantités x et y sont fonctions ré- 
ciproques l’une de l’autre, leurs dérivées en des points qui se correspondent sont 
1 
dx _ [+ 


inverses l’une de l’autre : 
dy dx 
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Exemple. Un point mobile M décrit un cercle de centre O et de rayon r. On le filme 
depuis un point fixe À situé à une distance d>r 
de O. Quelle relation différentielle y a-t-il entre 


_—— 


l'angle 0 — OÀ,OM qui repère la position de M et 


l'angle 4 — AO, AM que fait la caméra avec AO? 
Notons m la projection de M sur OA. On a Om 


rcos®, et mM=rsin0 donc tanç=— mM _ rsmÿ 
Am. d—rcos 


L'angle 4 est maximum quand AM est tangent 
au cercle, pour une valeur @max telle que sin(max) = . En posant a = r/d, il vient 


ui a sin 0 
? 1—acosû 


Les angles 6 et 0 sont des fonctions du temps qu’on suppose dérivables. 


- La différentielle de tan est (1+ tan? 4) d, 
cos 0 dO(1 — a cos 0) — sin O(a sin 0 dû) 


et la différentielle de sin O , donc 
1—acos (1 — acos0}? 
(1) (1 + tan? w) dy = a Es - dû 
(1 — acos 0) 
On en déduit que la dérivée de la fonction 0 (4) est _ 1. ne - en : 


L'angle 0 est une fonction 0(t) du temps. En divisant par dt dans (1) et en notant 


comme d'habitude  — _ et Ü — ie les dérivées par rapport au temps, on obtient 
| —a à; 
1 + tan? p)@(t) = a —® 
( PE = 0 0) 
Par exemple, pour 0 — 0, l'angle ç est nul et à cet instant, on a l'égalité & = T6. 
—@ 
Quand 6 = ouax, on a 0 — : — max, dOnC cos 0 = sin(Qmax) = & et @ = 0. 


Dérivée logarithmique 
Définition 
Soit f une fonction dérivable à valeurs strictement positives. La dérivée logarithmique 
J(æ) 
f@) 
dz 


En posant z= f(x), la différentielle de Inz est _ et l’on a les règles de calcul suivantes. 


d(ky) _ dy 
ky y 


de f est la dérivée de la fonction x + m(f(x)), c'est-à-dire 


Produit par une constante : Si X est une constante, alors 


è : ; d d 
Produit de fonctions : Si p — yz, alors ? = de. 
p y 7 


CHAPITRE 9 - LIMITES, DÉRIVÉES, INTÉGRALES - 279 


: : : d d 
Quotient de fonctions : Si q — y alors Se de, 
PA 


q y z 


Puissance d'une fonction : Si u = y°, alors ® = a+. 
üu 


Ces formules s’obtiennent en dérivant dans les relations In(ky)=Ink+Iny, In(yz)=Iny+lnz, 
In : =Iny-—Inz et In(y*) = alny. De même, si p = yz, alors dp = (dy)z + y(dz), donc 


dp _ (dy)z+y(dz) _ dy +de 
n) yz y 2: 


Exemple. On mesure le volume d’une sphère avec une erreur relative d'au plus 
10%. Comment estimer l'erreur que l’on commet en calculant le rayon ro ? 
d(r*) 


Le volume d’une sphère de rayon r est vu —(4/3)rr°. On a = 3 — ee, donc 
U | à) T 
dr : du, Si À vaut au plus 1/10, l’erreur relative sur le rayon est de l’ordre de 
Tr v v 
| =) 2 1 29 31 
1/30. Il vient donc < -- ou encore 570 <T < ET 
/ ro 30 0 


Coefficient d'élasticité. Supposons que des quantités x et y varient en fonction 


d'un paramètre en ayant des ordres de grandeur très différents : dans ce cas, la 
use À 
mesure de la dérivée T n'a pas grand sens. 
T 


y ox 


Mais si l’on considère des variations relatives et —, ces rapports ne sont pas 
T 


affectés par un changement e. 4 du type x - Kx ou y Ky. Il en va de même 


dx 


des dérivées logarithmiques © — et —, appelées élasticités de y et de x. Pour étudier 
y 


l'effet produit sur y par une ue de x, on définit le coefficient d'élasticité de y 
par rapport à x en posant : 


cute = SE = (H)(S) 


Par exemple, dans un marché de consommation, la quantité y demandée pour un bien 


donné dépend du prix p de ce bien. Certains modèles économiques proposent entre p 
et y une relation de la forme y = Ap”, où À est une constante positive et n un entier 


_ — dy = dp _ dy/y 
positif ou négatif. On a alors y —=Np et Eur = die 


est constant et vaut toujours n : on dit que la relation entre p et y est isoélastique. 


= n. Le coefficient d’élasticité 


Dans la plupart des cas, ce coefficient d’élasticité e,/, est négatif : en effet, une dimi- 
nution du prix augmente en général la demande, de sorte que la fonction p+ y est 
décroissante ; pour une fonction puissance y — p", cela veut dire que l’exposant n est 
négatif (on dit que le bien est typique). Cependant, certains biens de luxe (qualifiés 
d’atypiques) ont un coefficient d’élasticité positif. 


280 - FONCTIONS CONTINUES 


© Dunod -— La photocopie non autorisée est un délit. 


4. Fonctions continues 


Soit f une fonction à valeurs réelles définie sur un intervalle J et soit a € I. Pour 
être certain qu’en prenant des valeurs de plus en plus proches de a, on obtient des 
valeurs qui tendent vers f(a), il n’y a pas besoin que la fonction soit dérivable : il 


suffit que f(x) ait pour limite f(a) quand x tend vers a. 


Définition 
La fonction f est continue en a si lim f(x) — f(a). Si f est continue en tout point 
T—a@ 


de 1, on dit que f est continue sur 1. 


La fonction f est continue en a si pour tout nombre € > 0, il existe un intervalle 
[to — a,x0 + a], avec a > 0, sur lequel f ne prend que des valeurs comprises entre 


f(a)—e et f(a)+e. 


La propriété de continuité ne permet cependant pas de comparer les ordres de grandeur 


des écarts | f(x) — f(a)| et [x — a] pour x proche de «. 


Exemple. Définissons une fonction f en posant 


f(x)=2r-2 si 0<x<1 et f@)= L sir > 1. 


Ox — 9 
Cette fonction est continue en 1 : en effet, on a lim f(x) = lim (2x—x?) = 1 et 
z—17 x—1— 


lim f(x) = lim 1 = 3, donc la limite à gauche est égale à la limite à droite, la 
æ—1+" xæ—1+ 10x—9 
valeur commune étant f(1) = 1. 


- Pour h<0,ona f(1+h)=2(1+h)-(1+h)?=1—h?, donc le rapport fete Jo = 


22 
— tend vers 0 quand h tend vers 0 par valeurs négatives : la dérivée à gauche 


en 1 vaut 0, de sorte que l'accroissement f(1+h) — f(1) est négligeable devant À 


quand À tend vers O0 par valeurs négatives. 


- Pour h>0,ona f(1+h)=— se [1+10h] 1 =1-10h+ç(h), où y(h) .. he; 


_—__— 

10(1+h) 
la dérivée à droite en 1 vaut donc —10 et quand À tend vers O0 par valeurs 
positives, on a f(1+h) — f(1) = —10h. 


Puisque la dérivée à gauche en 1 n’est pas égale à la dérivée à y 
droite, la fonction f n’est pas dérivable en 1. Le graphe possède 
deux demi-tangente au point (1,1), l’une de pente 0, l’autre de 
pente —10. Selon le signe de h, les quantités [f(1+h)—f(1)]/h 
ont des ordres de grandeur très différents. 
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Propriétés des fonctions continues 

a) Si des fonctions f et g sont continues en a, leur somme x + f(x) + g(x) et leur 
(x) 
g(x) 


produit x + f(x)g(x) sont continus en a. Si de plus g(a) Z 0, le quotient x — 


est continue en a. 
b) Supposons que f est une fonction ayant pour limite à quand x tend vers xo. Si g est 
continue en a, alors g(f(x)) tend vers g(a) quand x tend vers x. 


c} Si une suite (u,) a pour limite à et si g est continue en à, alors g(u,) tend vers g(a). 


Supposons que f est une fonction continue en x, et que g est une fonction continue 
en a = f(xo). Alors f(x) tend vers a = f(xo) quand x tend vers x0, donc (propriété 
(b)), g(f(x)) tend vers g(a) = g(f(xo)) quand x tend vers 9. Cela veut dire que la 
composée x + (go f)(x) est continue en x. 
En particulier, si f et g sont continues en tout point et si la composée go f est 
définie, alors go f est continue en tout point. 


La composée de deux fonctions continues est continue. 


Proposition. Une fonction dérivable en a est continue en à. 


Démonstration. Si f est une fonction dérivable en a, alors f(x)— f(a)= f’(a)(x—a)+(x), 


#(@) 


où la fonction e(x) = tend vers 0 quand x tend vers a. Le produit (x — a)e(x) = (x) 


tend vers 0 quand x tend vers a, de même que f’(a)(x — a), donc aussi f(x) — f(a) : cela 
veut dire que l’on a lim f(x) = f(a). = 


Fonctions continues sur un intervalle 
Les fonctions qui sont continues sur tout un intervalle ont des propriétés fondamen- 
tales qu’on utilise constamment. Rappelons-les sans démonstration. 


Théorème des valeurs intermédiaires. Soit f une fonction à valeurs réelles con- 
tinue sur l'intervalle TI. Si a et b sont des éléments de I et si k est un nombre compris 
entre f(a) et f(b), il existe un nombre c compris entre a et b tel que f(c) = k. 


Application. Soit f une fonction à valeurs réelles continue sur un intervalle I. Si a 
et b sont des éléments de I tels que f(a) et f(b) sont de signes contraires, il existe un 
nombre c € Ja, b tel que f(c) = 0. 


C’est un énoncé utile pour montrer qu’une équation f(x) 0 possède au moins une 
solution. 


Pour le démontrer, on applique simplement le théorème des valeurs intermédiaires en 
choisissant la valeur k = 0 qui, par hypothèse, est bien comprise entre f(a) et f(b). 
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Exemple. Voici un tableau de quelques valeurs pour les fonctions xx? et x+(3/2)° 
(rappelons qu'on a posé a” —exp(rlna) si a est un nombre strictement positif). Puis- 


qu'on a (3/2)°=— > , il n’est pas difficile de calculer ces valeurs lorsque x est un entier. 


x 0 1 4 | 144 | 169 


(3/2) | 1 | 1,5 | 2,25 [129,7 194,6 


Les fonctions x? et (3/2)° sont toutes deux continues sur l'intervalle [0, +oo]. 

Pour æ=1, on a æ? <(3/2)° et pour x=2, on a x? >(3/2)%. La différence x? —(3/2)° 
change de signe entre 1 et 2 et c’est une fonction continue sur [0,+o[. D’après 
l'application du théorème des valeurs intermédiaires, il y a donc un nombre a €]1,2| 
tel que a? = (3/2)°. 

Pour x — 12, on a x? > (3/2)° et pour x — 13, on a x? < (3/2). À nouveau, la diffé- 
rence 2? — (3/2) change de signe entre 12 et 13, donc il y a un nombre 3€ ]12,13 
tel que 3? = (3/2)F. 

Ainsi l'équation x? = (3/2)° possède au moins les deux solutions « et B ; en étudiant 
plus précisément ces fonctions, on peut montrer qu’il n’y a pas d’autres solutions. 


Corollaire. Tout polynôme à coefficients réels et de degré impair possède au moins une 
racine réelle. 


Démonstration. Soit P un polynôme à coefficients réels et de degré n impair. Si le co- 
efficient dominant est par exemple positif, alors lim P(x) = +o et lim P(x) = -0c. Il 


s'ensuit que P(x) est positif pour des valeurs de x positives assez grandes et que P(x) est 
négatif pour des valeurs négatives de x assez grandes en valeur absolue. Puisque la fonction 
xt P(x) est continue sur R, l'équation P(x) = 0 possède au moins une solution dans R. m 


Fonction continue monotone. Une fonction continue et strictement monotone sur 
un intervalle I définit une bijection de I sur l'intervalle image f(T) et la bijection réciproque 
est continue. 


Fonction continue sur un segment. Soit f une fonction continue sur un segment 

[a, b]. 

a) Quand x parcourt [a,b], les valeurs f(x) ont un maximum et un minimum : il existe 
des éléments u et v de [a,b] tels que, pour tout x € [a,b], on a f(u) < f(x) < f(v). 
Le nombre m = f(u) est le minimum de f, le nombre M = f(v) est le maximum. 

b) Étant donné un nombre £ >0, on peut partager le segment [a,b] en sous-intervalles de lon- 
gueurs assez petites pour que sur chacun d'eux, la variation des valeurs de f n'excède pas €. 


Sur un intervalle qui n’est pas un segment, une fonction, même continue, n’atteint 
pas nécessairement un maximum : par exemple, la fonction x + x? sur [0,1] n’atteint 
pas son maximum sur [0,1[ (figure 1). 
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Si une fonction n’est pas continue en un point d’un segment, elle n’a pas forcément non 
plus de maximum sur ce segment : par exemple, en désignant par E(x) la partie entière 
du nombre x, la fonction x - x—E(x) n’atteint pas son maximum sur [0,1] (figure 2). 


figure 1 figure 2 


1 


0 EE 0 


La propriété (b) s'appelle la continuité uniforme. Elle exprime que si l’on se donne 
€ > 0, alors il existe a > 0 tel que, pour tous x et y dans [a.b] vérifiant }x — y| < a, 
on a |f(x) — f(y)|<e. 

Une fonction continue sur un intervalle 7 qui n’est pas un segment n’a pas forcément 
la propriété de continuité uniforme. 


Par exemple, pour la fonction f : R — R définie par f(x) = x°?, les valeurs x, = n et 
Un = Tn + 1/n sont très proches lorsque n est assez grand, mais les valeurs f(x,)=n? et 
f(Yn)=(n+1/n)? diffèrent toujours de f(y,)— f(r,)=(n+1/n)-n2=2+(1/n) > 2. 


5. L'intégrale 
5.1 Définition de l'intégrale 


Il s’agit de mesurer l'aire comprise entre le graphe d’une fonction et l'axe des x, sur 
un segment donné 1 = [a. b]. 

Pour cette question, les fonctions les plus simples sont les « fonctions en escalier » : 
elles sont constantes sur des sous-intervalles formant une partition de Z (figure 1). 
Si la fonction v prend les valeurs w,U2,...,v, sur ces intervalles, l'intégrale de v 
est par définition le nombre 


L(v) = vil + vole ++ ul 


où {1,...,{, sont les longueurs des intervalles. 


figure 1 


Dans l'intégrale, chaque aire de rectangle est 
comptée avec le signe de v; : positivement si 


v; est positif, négativement sinon. L'intégrale 
est donc une aire algébrique. 


Pour définir l'intégrale d’une fonction f plus 


générale, on l’encadre par des fonctions en es- 


calier u et v prenant des valeurs w1,...,u, et 


LL 
Patate Ta Te 


v1,...,%, Sur des sous-intervalles : sur la figure 


2, l'aire .# sous le graphe de f satisfait ainsi 
figure 2 
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l'encadrement 

I(u) = ul + u2lo + usls + als + usls < ed vil + vol + vsls + vala + vsls = T(v) 
Si l’on peut construire des encadrements de plus en plus précis, de manière que 
I(v) — I(u) tende vers 0, on prendra comme définition de l'intégrale de f la limite 
commune des nombres J(u) et T(v). 


Définition 

Soit f une fonction à valeurs réelles définie sur le segment [ab]. On dit que f 
est intégrable si pour tout nombre € > 0, il existe des fonctions en escalier uw et v 
telles que u(x) < f(x) < u(x) pour tout x € [a,b] et T(v) — T(u) < €. 


Toute fonction intégrable est à la fois majorée et minorée. 


Théorème. Une fonction monotone sur un segment est intégrable. 


Démonstration. Partageons le segment [ab] en n parties égales de longueur {= (b—a)/n : 
LT = [a, ai] , L = [a;, a] ag In = [an—1. 0], 
où a =a+{,as =a+2l,...,an 1 =a+(n—1){; posons de plus a = a et a, = b. Si f est 
une fonction croissante sur [ab], définissons des fonctions en escalier u et v comme suit : 
u(x) = fa) et v(x) = far), sirela,ayilet0<i<n—-1 
Pour tout x dans l'intervalle [a;,a;41[, on a u(x) = f(a;) < 
f(x) < f(ai1) = v(x), car f est croissante : les fonctions u et v 
encadrent donc f. Par définition, les intégrales de u et de v sont 


I(u) = f(ao){ + f(ai)£ +: f(an-1)€ 
Tv) = f(ai){ +... + f(an-1)0+ f(an)£, 


y À 


donc 

b— 
I(o)—I(u)=f(an)—f(ao=[f6)-f(a)le=[f6)-f(a) Te Te où @ 0 mb % 
Puisque en tend vers 0 quand n tend vers l'infini, on a ainsi construit des fonctions en 
escalier uw et v qui encadrent f et telles que J(v) — I(u) soit aussi petit qu’on veut. = 


Théorème. Une fonction continue sur un segment est intégrable. 


Démonstration. En utilisant la propriété (b] énoncée page 283, nous allons construire pour 

tout nombre £ > 0, des fonctions en escalier u et v telles que u(x)< f <v(x) et I(v)—I(u)<Ee. 

- On partage le segment [a,b] en n sous-segments J:,...,1, sur chacun desquels f varie 
d'au plus €/(b—a) ; 

- Puisque f est continue sur le segment J;, elle a un maximum sur 14 : on prend ce maxi- 
mum comme valeur de v(x) pour x € 1, (extrémité droite exclue). De même, on définit u 
en lui donnant sur /, la valeur minimum de f sur 1}. 


Pour tout x € 1,4, on a u(x) < f(x) <v(x) et comme les valeurs f(x) varient d’au plus £/(b—a) 
sur x, on a v(x) — u(x) £ e/(b—a) quel que soit x. En notant {1,..., {\ les longueurs des 
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segments J1,...,1,, il vient 
T(v)— Hu) & ER ++ EL, = EE ff +. +8,) = —E (ba) =e. 
— & 


Existence de l'intégrale. Si une fonction f : [a,b] — R est intégrable, il existe un 
unique nombre I(f), appelé l'intégrale de f, tel que I(u) £1I(f) £I(v) pour toutes fonctions 


b 
en escalier u et v vérifiant u(x) < f(x) < v(x). L'intégrale de f se note / f() dt. 


Nous admettons l'existence de l'intégrale. On peut aussi montrer que les fonctions en 
escalier obtenues en subdivisant [a,b] en sous-intervalles de plus en plus petits ont 
leur intégrale qui tend vers l'intégrale de f (pour une fonction f monotone ou con- 
tinue, cela ressort des démonstrations ci-dessus.) Intuitivement, l'intégrale de f sur 
[a, b] est bien l’aire algébrique comprise entre l’axe des abscisses et le graphe de f. 


Le signe |. évoque la lettre 5, initiale de «somme»etla y 


b 
notation | f(t) dt suggère qu’il faut penser l'intégrale 


comme la limite d’une somme de quantités infiniment 

petites dy = f(x)ôx : on imagine que ôy est l'aire d’un 

rectangle de hauteur f(x) et de base infiniment petite ôx. a} 
HA 


__ 
b x 


x+dx 
Raisonnement par infiniments petits. En Physique, on raisonne souvent en 
décomposant une quantité en une «somme d'infiniments petits» : cela conduit 
finalement à exprimer cette quantité sous la forme d’une intégrale. 


Exemple. La pression exercée sur un objet immergé dans un fluide à la profondeur 
h est P = ph, où p est la masse volumique du fluide. Cherchons la force exercée 
sur une plaque verticale immergée. 


YA 
Choisissons un axe vertical Oy et considérons dans la O 
plaque une tranche horizontale de hauteur infiniment pe- à 
tite dy située à la profondeur À ; sa longueur L est fonction PA : je 
de y. Sur cette tranche d’aire Lôy, le fluide exerce une 
force horizontale d'intensité PLôy = phLôy. On en déduit "0 
que la force exercée sur la plaque a pour intensité nr mn 
Yi 
F= [| ph(y)L(u)du 
Yo 
où Yo et y1 sont les valeurs de y à la base et au sommet de la plaque. YA 
O 


Supposons par exemple qu'un canal est fermé par une F 
vanne coulissante en forme de trapèze. Dirigeons l’axe Oy y (y) 
vers le haut et prenons son origine à la surface de l’eau. x \uof y —+ 
La profondeur est donc h(y) = —y. Notons Lo la longueur 1 yo 

de la base inférieure de la plaque, L; la longueur du coté 
supérieur et H la hauteur. Entre % et 1, L(y) varie proportionnellement : 
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L(y) — Lo y—Y% __y—-% 
Li — Lo Y1 — Yo H 


d'où L(y)=Lo+ la di (y — Yo) = li Te y+Lo li Te Yo. Il vient, puisque p= 1 : 
yi Yi 
Li Lo,2 _ Loyi — Liyo 
r= | ul du = | | y y| dy 
yo Yo H H 


5.2 Propriétés de l'intégrale 


Elles résultent des propriétés de l'intégrale d’une fonction en escalier. 


Supposons que « est une fonction en escalier, constante sur les intervalles d’extrémités 
a = Gp < A °°: <'An_1 < Am = D. 

Pour tout nombre réel À, la fonction Au:xt+ Au(x) est constante sur ces mêmes 
intervalles, donc est en escalier, et l’on a Z(Au) = AT(u). 

Soit u” une fonction en escalier constante sur les intervalles d’extrémités a <a <:--<a,,_;<b. 
En mettant ensemble les points a; et a!, on définit un partage de [ab] en intervalles 
sur lesquels u et u’ sont constantes : les fonctions u + u’ et uu’ sont alors constantes 
sur ces intervalles. Remarquons que l’on a Z(u+u') = I(u) + I(u') et que si u est une 
fonction en escalier positive ou nulle, alors Z(u) est un nombre positif ou nul. 

En passant à la limite quand la longueur des intervalles tend vers 0, on obtient les 
propriétés suivantes. 


a) Si f est intégrable sur [a,b], alors pour tout nombre X, la fonction x + Àf(x) est 
intégrable et l'on a [ ÀAf (€) dt = à FC) dt. 

b) Si f et g sont intégrables sur [a,b], alors la fonction x — f(x) + g(x) est intégrable 
et l'on a [ [()+a(6)] dt = [ f(t) dt + ['9® dt. 

c) Si f(x) > 0 pour tout x, alors 7 f() dt > 0. 

d) Si f et g sont intégrables sur [a,b], leur produit x + f(x)g(x) est intégrable. 

Les deux premières propriétés signifient que l’ensemble des fonctions intégrables sur 

[a, b] est un espace vectoriel et que l'application f L . f(t) dt est une application 

linéaire. 

La propriété (c) affirme que l'intégrale d’une fonction positive ou nulle est positive 


ou nulle. Si f et g sont intégrables et si f > g, alors la fonction f—g est positive 
ou nulle, donc son intégrale aussi : 


b b 
si f(x) > g(x) pour tout x € [a,b], alors | f() dt > | g(t) dt. 


Si f est intégrable sur [ab], elle est intégrable sur tout segment |c, d] inclus dans 
(a, b]. On pose : 


c d c 
4 FE) dt = - f f(t) dt et | f(€) dt = 0 pour tous nombres c et d dans [a, b]. 
d € ë 
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Pour tous nombres x,y,2 dans [a,b], on a alors l'égalité : 


[ IG a+ [160 t) dt = Î ft) dt (relation de Chasles) 


Inégalité fondamentale. Si f est une fonction intégrable sur [a, b|, alors 


' F0 at “a "LfOIat 


Démonstration. Puisqu'on a —|f(x)|<f(x)<|f(x)| pour tout x, il vient en effet = fr@) di= 
b b b : 
L-roa< f'roat< f'irlar. el 


Proposition. Soit f une fonction continue et positive ou nulle sur le segment [a,b]. Si 
b 
j FC) dt = 0, alors f(x) — 0 quel que soit x € [a, b]. 


Démonstration. Raisonnons par l’absurde en supposant que f prend en un point c € [a.b] 
une valeur f(c) >0. Puisque f est continue en c, il y a un intervalle autour de c où les valeurs 
de f sont supérieures à un nombre m > 0. En appelant u et v les extrémités de cet intervalle, 


b v b 
on a | f(t) dt > Î f(t) dt, car f est positive ou nulle, d’où Î f(€) dt > (v—u)m > 0, ce qui 


est une contradiction. = 


Intégrale fonction de la borne supérieure 
Proposition. Si f est une fonction intégrable sur [ab], alors la fonction x + de f() dt 
est continue sur [a, b]. 


Démonstration. Posons en effet F(x >= f" f(t) dt. Si x € [a.b], alors d’après la relation de 


Chasles, ona /. f(t) dt= CCE) )at+ [° f(t) dt, ou encore F(x)=F(xo ES f(t) dt. Puisque 


f est majorée et minorée, il existe un He M tel que |f(x)|< M pour tout x. D’après l’iné- 


<|frar 


æ tend vers to, |t — xol tend vers 0 et donc F(x) tend vers F(x0). = 


galité fondamentale, il vient |F(x) — F(xo)| < \f |f(E)| dt = M\x — xo|. Quand 
TO 


Exemple. Prenons la fonction en escalier définie sur [—1,1] par f(x)=1 si -1<x<0 
et f(x) = —1 si 0 < x < 1. Posons F(x j=) A J(t) dt. 

Si x € [-1,0] : alors f(t) = 1 sur l'intervalle [—-1,x], donc F(x =}. 1 dt = x+1. 
Si . 1] : alors f(t) = —1 sur l'intervalle ]0,x], donc 0) d= |” (—1) dt = -x 


0 
et F(x )= fre )dt+ |" F(E) t)dt = F(0)-x=1-#. 
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la fonction f 


—1 17 
la fonction F 


La fonction f n’est pas continue en 0, mais F est continue sur [-1,1]. 


Voici une proposition permettant, pour des fonctions positives, d'intégrer un infini- 
ment petit ou un équivalent. 


Proposition. Soient u et v des fonctions intégrables sur [a,b] et soit x0 € [a, b]. 
Supposons v(x) > 0 pour tout x £ xo. 


— Si u(x) .. v(x), alors ([ u(t) dt) « de u(t) dt). 


TT) 
Si u(x) + v(x), alors ([ u(t) dt) u ([ u(t) dt). 
T—T0 To T—TO To 
Démonstration. Supposons u(x) infiniment petit devant v(x) quand x tend vers o. 
Alors (x) = no tend vers 0 et u(x) = v(x)w(x). Étant donné un nombre € > 0, on a 
v(x 


ly(x)l <E pour tout x assez proche de 6, donc aussi [u(x)| < eu(x), car v(x) est positif. 


Uu(e)dtl< | [pute dtl < | [7 eut) dt| =] [” o(t) dt 
Futar)<| FF tete <| FF evto at) <e) F0 
Cf u(t) at) / (£ v(t) at) est en valeur absolue inférieur à €. 

TO TO 


Supposons u(x) équivalent à v(x) quand x tend vers x9, donc [u(x)—v(x)] & v(x). D'après 


T—TO 


Pour de tels x, il vient < et le rapport 


œ 


ce qu’on vient de montrer, on a | [u(t)—v(t)] dt <« v(t) dt, ou encore 


TO æ—2zo /xo 
fl u(t) dt - f u(t) a « | u(t) dt. 
z0 zo T—TO x0 
Ainsi, Î L u(t) dt est équivalent à . , u(t) dt quand x tend vers x. = 
TO TO 


5.3 Moyenne d'une fonction 


Définition , 
Si f est une fonction intégrable sur [a,b|, le nombre — | f(t) dt s'appelle la 
moyenne de f sur [a,b]. 


Proposition. Soit f une fonction continue sur [a,b] et soit w une fonction intégrable 
à valeurs positives ou nulles et d'intégrale strictement positive. Alors il existe un nombre 
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cE [a,b] tel que 


Démonstration. Soit m le minimum de f sur [a,b] et M son maximum. Pour tout 
tE [ab], on a m< f(t) < M, donc aussi mut(t) < f(t)w(t) £ Muw(t), car w(t) est posi- 
w 


b b 
tif ou nul. En intégrant, on obtient m | w(t) dt < (4) f (6) dt < M] w(t) dt. Le nombre 


b b 
(/ w(t) f(t) àt) ". él w(t) at) est entre m et M, donc est égal à une certaine valeur f(c) 


a a 


de la fonction f, d’après le théorème des valeurs intermédiaires. = 
En choisissant w(t) — 1 pour tout t, on obtient le résultat suivant. 


Formule de la moyenne. Si f est une fonction continue sur [a,b], il existe c € [a,b] 


b 
tel que Î FC) dt = (b— a)f(c). 


b 
Pour une fonction continue, la moyenne — Î f(t) dt est donc l’une des valeurs 
= 
de la fonction. 


Moyenne d'une fonction monotone 
Supposons que f est une fonction monotone sur [ab] et partageons [a.b] en n segments 
de même longueur h—(b—a)/n, donc d’extrémités a=ao,a1=a+h,a2=a+2h,...,an_1= 


a+(n—1)h,a,=b. Nous avons montré page 285 que É à ? [f(ao)+f(ai)+--:+f(an-1)] 


b 
tend vers | f(t) dt quand n tend vers l'infini. 


b 


[f(ao)+.f(a1)+ ... +f(an-1)] tend vers . J(t) dt. 


Quand n tend vers l'infini, L 
n —@ Ja 


Si l'on fait la moyenne des valeurs de f en des points régulièrement répartis dans 
(a, b], on obtient des nombres qui tendent vers la moyenne de f quand le nombre 
de points tend vers l'infini. 


5.4 Primitives 
Si une fonction f est intégrable, la fonction F(x)= 1 : f(t) dt est continue (proposition 


page 288). Nous allons voir que si f est continue, alors F(x) est dérivable. 


Rappelons que, par définition, une primitive de f est une fonction ® dérivable telle 
que D’ = f. 


Théorème fondamental. 5: f est une fonction continue sur un intervalle I et si a€l, 
alors la fonction F(x)= [”f(#) dt est une primitive de f : on a F'(x)= f(x) pour tout xeT. 
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Démonstration. Donnons-nous x € 1 et posons yo = f(æ0). Puisque f(x) = yo + (f(x)—Y0), 
on a 


Ga z 


F(&) — F(&0) = | “= J'ua+] PO | (F(-vo)dt 


Posons u(x) = Fi (f(t)—Yo) dt. Étant donné un nombre € > 0, on sait que pour tout { assez 
TO 


proche de xo, on a |f(t)—yol < €, donc pour x proche de x6, il vient 


(f(6)—yo)dt [2 1r@-vo1at [<« 


0 
Ainsi u(x) est infiniment petit devant |x—x0| quand x tend vers x. Puisque F(x) = 
F(xo)+yo(r—-to)+u(x), cela signifie d’après la proposition page 271, que l’on a F’(x%6)=%o. M 


lu(æ)| = < < = (20e 


Ce théorème affirme que toute fonction continue sur un intervalle possède une 
primitive. 
Rappel. Si F est une primitive de f sur un intervalle, les autres primitives de f sont 


les fonctions F(x) + c, où c est une constante quelconque. 


Nous verrons en effet au début du prochain chapitre que si l’on a F'(x)—G"(x) =0 en 
tout point x d’un intervalle, alors la fonction F—G est constante sur cet intervalle. 


Exemple. Reprenons la fonction F de l'exemple page 288 et calculons U(x) — 
É F(t) dt pour x € [-—1,1]. 
Puisque F est continue sur [-1,1], on sait que la fonction U est une primitive de 
F : on a U'(x) = F(x) pour tout x € ]-1,1|. 
Pour æ€[-1,0], on a F(x)=x+1, donc U(x)—2?/2+x+0c, où c est une constante. 
Par définition de U, on a U(—1) = 0, donc 1/2-1+c—0 et c = 1/2 : 
2 

U(x) = à + x + pour tout x € [-1,0]. 

Supposons x € [0,1]. Alors U(x) =U(0)+ Î © F(t) dt=1/2+ Î © (+1) dt. L'intégrale 


vaut —x?/2 + x + d et elle est nulle pour x — 0, donc d = 0. Par suite 


2 
U(r)=-S +z+ > pour tout x € [0,1]. 


y y 


D > 
1 1H = 1 æ 


graphe de F graphe de U 


Nous voyons que lorsqu'on intègre une fonction, on la rend plus régulière : la 
fonction F n’est pas dérivable en 0, mais la fonction U est dérivable. 
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Intégrale d'une fonction paire ou impaire. Soit f une fonction continue sur 
[-a, a]. Posons F(x) = . f(6) dt, pour tout x € [-a, a]. 


Si la fonction f est paire, alors 


f(E) dt = - [ f(t) dt et f(t) dt = 2 | f(t) dt, pour tout x € [-a, à]. 
0 0 x 0 
Si f est impaire, alors 


Î roa= | f(t) dt et Î f(t)dt=0, pour tout x € [-a, a]. 


T 


Posons en effet F(x)= [| f(t) dt. La dérivée de F( x) est —F'(—-x)=-—f(-x), car F'=f. 


Si f est paire, alors r LF(-x)] =-f(-x) = f(x) = . [-F(x)]. Les fonctions F(—x) 

et —F(x) ont la même dérivée et prennent en x = 0 la même valeur 0, donc elles sont 
FA 0 FA 

égales. D’après la relation de Chasles, il vient alors Î f() dt = Î f(E) dt + Î f(t) dt = 


—F(-x) + F(x) = 2F(x). On raisonne de même si f est impaire : dans ce cas, les 


fonctions F(—x) et F(x) ont même dérivée et coïncident en 0, donc elles sont égales. 


a Exercices mms 


@ 1. À chaque graphe d’une fonction f ci-dessous, associer le graphe de la dérivée f’. 
que grap grap 
graphe de la fonction f : 


y y y L/ y Ne 
% % z | % 
(c] (d} 


(a) (b) 
graphe de la dérivée f : 


y y y y 
HA 
HA 
LT T 
(3) (4) 


(1) (2) 


@ 2. À chaque graphe d’une fonction f ci-dessous, associer le graphe du carré de f et 


de la racine carrée de f. 
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« 


@ 1. 


graphe de f(x) : 


y y y y 
T T 
HA T 
(a) (b] (c) (d) 


graphe de HOIR 
y y y y 


8Y 
8 
8 
8Y 


(1) (2) (3) (4) 
graphe de 4/f(x) : 
y y y y 


8Y 
& 
8 
E 


(i) (ii) (iii) (iv) 


Application de la formule de Stirling. Montrer que le coefficient binomial (”) est 


- 1 4 PS 
équivalent à —— = quand n tend vers l'infini. 
q de q 


Étude d'un point fixe 


a) Représenter sur un même dessin les graphes des fonctions x, e- (1/27, e-? et e-2??, 
Étant donné un nombre réel a > 0, quel est le signe de e “x pour x très 
grand ? Quel est le signe pour x < 0? Montrer que, pour tout a > 0, la fonction 


f(x) = e7% à un unique point fixe; on note s(a) ce point fixe. 


b) Que vaut s(0) ? Montrer que l’on a ex > 0 si 0 <x<s(a) et ex <0 
si x > s(a). Montrer que si 0 < a < b, alors e %)_5{b) > 0. En déduire que la 
fonction a+ s(a) est décroissante. Montrer que s(a) tend vers Ü quand a tend 
vers +oco (raisonner par l'absurde en supposant que la limite est un nombre { > 0 
et en utilisant l'égalité as(a) = — In s(a)). 

c) Montrer que la fonction t+- ts(t) est croissante et que l’on a s(t) > 1/t (utiliser 

t—+00 
le résultat précédent). Dessiner l'allure de la fonction t + s(t). 
—ts(t) 


d) Admettons que la fonction s est dérivable. En utilisant l'égalité s(t) = e : 


montrer que la fonction s(t) est solution de l’équation différentielle y = — 


1+ty 
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@ 5. Somme de plusieurs fonctions périodiques. On dit qu’une fonction f est périodique (de 
période T Æ 0) si l’on a f(x+T) = f(x) quel que soit x ER. 


a) Soit f une fonction périodique de période T' et dérivable. Montrer que f’ est 
périodique de période T. Montrer que la fonction 1+ cos x est périodique, mais 
qu'elle n’a aucune primitive périodique. 


b) Posons f(x) = asinazx+bsinBx, où a,b,a,/3 sont des nombres réels tous non nuls. 
Nous allons voir que f ne peut être périodique que si 8/a est un nombre rationnel. 
(il Supposons que f est périodique de période T’. En considérant f”, montrer que 
{ asin aT' + bsin FT — 0 


né at ED ln OT 0° Montrer que si a £ +, alors sinaT =sin 5T = 0. 
En déduire qu'il existe des entiers n et k tels que B/a = n/k. 
ii Montrer que si B/a = n/k, avec n et k entiers, alors f a pour période 27k 
[02 
«) Montrer que la fonction sin (+) +sin(V3x) n’est pas périodique (en procédant 
comme ci-dessus, montrer que si cette fonction avait une période 7, alors on 


aurait sin (L+v) = siny, puis en déduire une contradiction). 


d) Soit qg un entier positif. La fonction 2sin3x+sin 2 — cos ? est périodique : quelle est 
q 


sa période ? (la réponse n’est pas la même selon que q est multiple de 3, ou non). 


6. À la distance r du centre d’une artère de rayon À, la vitesse du sang est v—c(R?-7r?), 
où c est une constante. Quand on administre une substance par voie intraveineuse, l’ar- 


tère se dilate légèrement, à un rythme constant p= ee De combien varie la vitesse du 


sang à la distance r du centre ? (c=3,2.10° Sn ls À hé cm et p=iit cms !) 


@ 7. Utilisation de la différentielle logarithmique. Un ballon sphérique en matière élastique, 
rempli d'air, subit simultanément une variation relative de pression de 5% et une 
variation relative de température de 2%. On suppose que l'air suit la loi PV7/T = 
constante, où P est la pression, V le volume, T' la température absolue et où 7—1,4. 
Quelle est la variation relative du diamètre du ballon ? 


8. Au cours d’un trajet sur autoroute, un automobiliste a parcouru 200 km en deux 
heures (avec des arrêts éventuels). On mesure le temps t en heures et l’on note f(t) 
le nombre de kilomètres parcourus depuis le départ. Posons gt) = f(t+ 1) — f(t) 
pour O<t<]I. 


a) Montrer que g(t) est positif ou nul et que g(0) + g(1) = 200. En déduire que la 
fonction g(t) — 100 ne garde pas un signe constant. 


b) Montrer qu’il existe une durée d’une heure pendant laquelle l’automobiliste a 
parcouru exactement 100 km. 
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@ 9. Comparaison d'ordres de grandeur 


a) Comparer les ordres de grandeur des fonctions /x et (Inx)* quand x tend vers 
+0 et en déduire la partie principale de ,/x + (In x)°. 


b) Comparer les ordres de grandeur des fonctions xe-*, e-*/x et e quand x tend 
vers +00. 


«) Montrer que Î : t[1+ cost]® dt est équivalent à 2% lx? quand x tend vers 0. 


d) Montrer que : Re a pour partie principale 3 en quand x tend 
vers 1. 
10. a) Justifier les formules suivantes : 
a r/4 
(i) (et—e"t)(sint)? dt = 0 (i) | [1+ (cost){le’ dt > (5/4)(e7/1—1) 
—& 0 


b) Dessiner le graphe de la fonction 1-2 entre 0 et 1. En déduire que si 0<a<b<1, 
b . 
alors | Vi1-E dt > ES [V1-a + vV1-b]. 
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Chapitre 10 


Utilisation de la 
dérivée et de l'intégrale 


1. Étude des variations d'une fonction 


La dérivée f'(a) d’une fonction f en un point a est le taux de proportionnalité entre 
les infiniments petits f(x)—f(a) et x—a, quand x tend vers a : la dérivée en a ne 
fait intervenir que les valeurs f(x) pour x voisin de a. 

Nous allons voir que si f a une dérivée en tout point d’un intervalle J, les nombres 


F(b)—f(a) 


f'(x) donnent un contrôle sur tous les taux d’accroissement 
soient a et b dans 1. 


, quels que 


Théorème des accroissements finis. Soit f une fonction dérivable 
sur un intervalle I. Pour tous nombres a et b dans I, il existe un nombre 
c strictement compris entre a et b tel que f(b) — f(a) =(b—a)f'(c). 

b) — f(a 
OO (x) = K(e — a) + (a). 
Les fonctions f et sont continues, donc aussi leur différence u(x) = 


f(x) — p(x). D'après les propriétés des fonctions continues sur un seg- La tangente en C 
est parallèle à la corde 


Démonstration. Posons k — 


b x 


ment, il y a un nombre c entre a et b où u(x) atteint son maximum 
(page 283). On sait qu’en ce point c, la tangente au graphe de uw est horizontale, donc 
u'(c) = f'(c) — g'(c) = 0. Puisque p'(x) = k, il vient f'(c) = k. = 


Une première conséquence du théorème, c’est qu’au moyen de la dérivée, on peut 
caractériser les fonctions constantes, les fonctions croissantes et les fonctions décrois- 
santes. 
Caractérisation des fonctions constantes. Si f(x) —0 pour tout x € I, alors f est 
constante. 
Caractérisation des fonctions monotones 
Si f'(x) >0 pour tout x ET, alors f est croissante sur 1. Si f’(x)>0 sauf peut-être 
pour un nombre fini de valeurs de x, alors f est strictement croissante sur Î. 
— De même, si f'(x) <0 pour tout x € I, f est décroissante sur I. 
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Application aux primitives 
Soit f une fonction continue sur un intervalle I et soit xo € I. 


— Si Fest une primitive de f, alors F(x) = f f(t) dt. 


Toute primitive de f s'écrit F(x En f() . + c, où c est une constante. 


On sait que la fonction U(x t) dt est une primitive de f telle que U(x9) = 0. Si 
q P q 


Fest une autre primitive de r alé U'=f=F",U'-F'=0, donc la fonction U-F 
est constante. Comme cette fonction prend en x, la valeur U(xo) — F(xo) = —F(xo), 
on en déduit U(x) = F(x) — F(xo) pour tout x € I. 


Notation. On notera simplement Î f(6) dt une primitive de f. On écrit alors par 
exemple sin x — Î cost dt : c'est une égalité de fonctions à constante près. 


Les primitives suivantes s’obtiennent par dérivation, en vérifiant simplement que dans 
chaque cas, la dérivée du second membre est égale à la fonction sous le signe intégrale. 


Primitives usuelles 


a 1 a+1l : dt 1 
dt = —] = = | b 
| nd , Sax EE Qmlaz+ | 
jrus 1 En futat=zms-x 
= À 3 : rl 
Jeostat = = sin(ax) J sine dt — —-— cos(ax) 
a a 
Î dt al a | a — l 
co sin” tan x 
Î = = = À h;ctan © Î … =. In Mare 
a de a a &—t®  2a a—x 
1-4 = In(x + Va? + x?) Î 4 = ares © 
en a = a 


las" 


L'inégalité des accroissements finis 

Soit f une fonction dérivable sur un intervalle 1. Appliquons le théorème des ac- 
croissements finis entre des nombres x et y de I et prenons les valeurs absolues : on 
obtient |f(æ)— f(y)|=1x-||#(2) 


Proposition. Supposons qu'on a la majoration |f'(t)| £ M pour tout t € I. Alors pour 
tous nombres x et y dans 1,on a Lt) — f(y)| < M}x — y|. 


Cette majoration très importante s'appelle l'inégalité des accroissements finis. 
Si l’on connaît un majorant de la fonction t+- |f'(t)| sur un segment, l'inégalité 
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des accroissements finis permet de calculer un encadrement pour les valeurs de la 
fonction f sur ce segment. 


Exemple. Le dispositif ci-dessous montre un disque mobile autour d’un axe 
horizontal en ©. Le point T,, à la verticale de O, est relié à un ressort À par un fil AT. 
Au point B situé à l’horizontale de O, on laisse pendre une masse m. La roue tourne 


alors d’un angle 6, le ressort s’allonge de AA'=x et le fil s’enroule le long de l’arc TT”. 


-CO- ‘à 


Notons r le rayon de la roue et d la distance OB. À l’équilibre, le point d'attache 
du poids est en B' et le vecteur OB! fait l'angle 0 avec l’horizontale. 

Le poids P appliqué en B’ a pour valeur mg et le ressort exerce en T' une force 
de rappel F horizontale d'intensité kr, où k est le coefficient de dureté du ressort. 
À l'équilibre, les moments de P et F ont la même valeur numérique : 

- le moment de Fest FxOT=kxxr 

- le moment de P est P x OC" = P x OB/'cos 0 = mg x dcos 0. 


La distance x est égale à la longueur de l'arc TT”, donc x = r60. La condition 
d'équilibre s'écrit kxr — kr?0 = mgdcos6, c'est-à-dire 


mg 
1 0 = —- cos 0 
(1) Le 
Puisqu'il existe évidemment une position d'équilibre, l'équation (1) a une solution 
: : ; : d 
0. On peut le démontrer en introduisant la fonction continue u(0) — . cos Ü — 6. 
Tr 


La valeur u(0) = mgd/kr? est positive et u(r/2) = —x/2 < 0 : d’après le théorème 
des valeurs intermédiaires, l'équation (1) a au moins une solution entre 0 et x/2. 
La fonction 0 + cos 0 étant strictement décroissante sur [0,r/2], u est strictement 
décroissante entre 0 et 7/2, donc la solution @. est unique. 

mgd 
kr? 
de la fonction f. On a f'(8) =—-Ksin6, 
finis pour la fonction f entre 0 et 0. s'écrit : 


(2) | f(6) — f(8.)| < K\0 — 8.| 


Posons X — et f(0) = Kcos0. Puisque f(4,)—@., la solution 4, est un point fixe 


J' (8)| < K et l'inégalité des accroissements 
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Supposons Æ < 1. Alors la fonction f est contractante au voisinage du point fixe 
0e (page 262) : le coefficient de contraction est K° et le cône de contraction s'étend sur 
tout l'intervalle [0,7/2]. Dans ces conditions, on sait que le point fixe est attractif : la 
suite (u,) des itérés d’un point quelconque wo € [0,x/2] a pour limite le point fixe. 
Pour calculer une valeur approchée de 6, il suffit de choisir un nombre initial wo 
entre 0 et x/2 et de calculer successivement les nombres uw, définis par un+1= f(un) : 
puisque u, tend vers 0., on obtiendra, pour n assez grand, des valeurs approchées 
de la solution. 


2. Développements limités 
2.1 Approximation à l'ordre n 


Si une fonction dérivable f vérifie f(a) = f'(a) —0, alors quand x tend vers a, f(x) 
est infiniment petit devant æ—a. Plus généralement, pour une fonction f ayant des 
dérivées successives f', f", f(),..., f(0), où f(" désigne la dérivée n-ième de f, on 
a le résultat suivant. 


Proposition. Si f(a) = f'(a) = f"{(a) == fl) (a) —0, alors f(x) € (x-a)". 


T—a 


Démonstration. Appliquons le théorème des accroissements finis entre a et x : 
on a f(x) = f(x) — f(a) = (x — a)f'(x1) avec x1 entre a et x, donc 
(1) [F1 < le — all f(ai)| et [ral < x-al 
Appliquons le théorème pour f’ entre a et x1 :ona f'(x1)= f'(x1) — f'(a) =(x1 —a)f"(x2), 
où 2 est entre a et x, donc entre a et x, et par suite 
(2) f'(&1)| <lx— al|f"(æ2)| et r2—al < x—al 
Poursuivons ainsi jusqu’à la dérivée (n—2)-ième : 
ona fr-2) (x, 9) = fr) (x 2) — FD (a) = (xp _2 — a) f(x, _1), où Tn_1 est entre 
a et ïn_°2, donc entre a et x, et il vient 
(n—1) LP (an 2)| < le — al (an 1)| et [en-1-al < [ral 
En mettant bout à bout ces n—1 inégalités, on obtient 
LG) < le al| f'(e1)| < 1e — al |f"(e2)| < +++ < [re — al 9 (an _1)| 


Divisons par |x — a|” (qui est positif) : 


f(x) FN (an1)| 2 GR) PQ LMP GR) = SPP (| 
(x — a)" æ—a [x — à d (En-1 — à 
Quand x tend vers a, z,-_1 tend vers a et le rapport de droite tend par définition vers 
|f() (a) = 0. Le rapport Te a donc pour limite O0 quand x tend vers a. Œü 
x—a 


Définissons un polynôme P qui a les mêmes dérivées que f au point a jusqu'à 
P%) (a) 
k! 


l'ordre n : on sait que si P = po + pifx — a) +--- + pa(x — a)", alors px = 
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pour tout entier k > 0 (si k — 0, on convient que P( = P). En posant 


! {14 
on obtient donc un polynôme tel que P(a)= f(a), P'(a)= f'(a),..…., PUY (a) = fl (a). 
Le polynôme P est le seul polynôme de degré inférieur ou égal à n ayant au point a les 
mêmes dérivées que f jusqu'à l’ordre n. 

Pour la fonction u(x) = f(x) — P(x), on aura alors u(a) = w/(a) = -:: = ul) (a) = 0 
et d’après le résultat précédent, [f(x)—P(x)] & (æ—a)". 


P(x) = f(a) + 


(æ— a) + 


La formule de Taylor-Young. Pour une fonction f ayant des dérivées jusqu’à l'ordre 


n,on a 
se = 14 LO (o-a+ LO (aa ©) (oops) 
où px) € (æ-0)" 
Définition , , ” 
Le polynôme P(x) — st (x ax 1 (x débreEr …. (x—a)" s'ap- 


pelle le développement limité ou l'approximation à l'ordre n de f au point a. 


D'après la formule de Taylor-Young, l’approximation à l’ordre n est unique. 
À l'ordre 1, le développement limité au point a est f(a) + f'(a)(x — a) : c'est 
l’'approximation affine de f au point a (page 272). 


2.2 Calcul des développements limités 


Notation petit o : Supposons que n est un entier positif. Toute quantité qui est 
infiniment petite devant (x—a)" quand x tend vers a, se note o[(x—a)"], ce qui se 
lit «petit o de (x—a)" ». 

Ainsi par exemple, on a x° = o(x?) (infiniments petits quand x tend vers 0) et 
(x—a)? = o(x—a) (infiniments petits quand x tend vers a). 

On peut calculer les développements limités au moyen de la formule de Young, mais 
au prix de plusieurs dérivations. Voici un premier outil de calcul bien commode. 


Intégration d'un développement limité. Supposons que le développement limité 
à l'ordre n de f en a est f(x) = po + pi(x—a) +++ p,(x-a)" +of(x-a)"]. 
Si Fest une primitive de f, alors 

F(x) = F(a) + po(x-a) + D (œ-a) ++ _ ea) +o[(e-a)"*]. 


Démonstration. Supposons pour simplifier a=0, de sorte que f(x)=po+pit+-+p,x"+0(x"). 
Si F est une primitive de f, alors 


F(a) = FO) + / f() dt = F(0) + por + Ex? +...+ Pr sn + | o(#") dt 
0 2 n +1 Jo 
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On sait qu’en intégrant de 0 à x une fonction de t qui est négligeable devant {” quand t tend 
n+1 
z 


| n+l 
(page 289), donc j o(t”) dt = o(x"tt), I 


vers 0, on obtient, quand x tend vers 0, une quantité négligeable devant l) Lt dt = 
0 


Mis à part l'intégration, on peut ajouter ou multiplier des développements limités 
au même point et au même ordre. 
Quelques développements limités usuels au point 0 
1) À l’ordre 1, on a l’approximation affine e° = 1+x+o(x). En intégrant, on en 
déduit e? — el — [ édt= [ (1+t) dt + o(x?) = x + A + o(x?), c'est-à-dire 
ee =1l+r+ 32 +o(x) 


En intégrant à nouveau, il vient de même e° — 1 = [ (1 +t+ 1#) dt + o(x°), 
ou encore 
e=1+r+ li 158 + o(x$) 


2 2-3 
Si l’on continue à intégrer, on obtient les développements à des ordres plus élevés. 
mnt 
2) Pour n entier positif, écrivons l'identité 1 . =1l+x+...+1x" sous la forme 
n+1 
es =l+rm+..+at+T 
1=% 1—x 
n+1 
Quand x tend vers 0, — tend vers 1, donc © = o(x"). On en déduit que 
—T —T 
le développement limité de ne à l’ordre n en 0 est : 
—T 
TL = q4ptidta o(r) 
1—x 


2 


En changeant x en —x, puis x en x”, on trouve 


ee =1-x+x—...+(—1)"x" +o(x") 


: == +at...+ (1) +o(rtt) 
1+x 
Dans le dernier développement, on a gagné un ordre, car on sait que tous les termes 


sont d’exposant pair. 


3) Intégrons le développement — =l+z+..+atlho(x ht, 


Puisque L _. = —In(1-x), il vient 
Mm(1—x) = —-x LS LA +. La" + o(a") 
4) On a  — 1— 2x? +o(x°), donc Arctanx = x — A + o(x). 
PA 
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5)On sait que sinx = x+o(x). Puisque sintdt —1—cosx, on a 1 —cosx — 
à +o(x?), c'est-à-dire cosx = 1— à + o(x?). En intégrant à nouveau, on obtient 
snT—=x— a + o(x°) et en poursuivant ainsi, on trouve les développements à 
des ordres supérieurs. 


6) Cherchons le développement limité de V1-—x en 0 à l’ordre 3 : la dérivée de V1-x 
est D elle vaut —1 / 2 en x = 0, donc le développement cherché s'écrit 
—X 


Vi-x =1— … + ax? + bx° + o(x°) 
Élevons au carré en négligeant les termes infiniment petits devant x : 


2 
1x = 1+2 (- le)+(1) r?+2ax?+2 (- ls) (ax?)+2bx° + o(x°) 
=i-z+ (2a+ ni + (2b — a)x° + o(x°) 


Puisque le développement limité est unique, les parties polynômes sont les mêmes, 


1 = — = 1 = _1 — 10 
donc 2a + 1 2b— a —0, ce qui donne a g’ b 6 et 
Vi-x=I1 5e A LE x + o(x) 


Principaux développements en 0 


— =l+z+...+x"+o(x") 
et =i+a+La+...+ Lonto(xr) 
2! n! 
In(1 +x) = x— Du + 22° + (x) 


1 1 1 


snz=æ— æ +o(x), cosz=1— 2 +o(x), tan x = x + 37 +o(x) 


Arcsin x = x + A +o(x*), Arctanz =x-— LA + o(x*) 


{i-x)/2=1- De — LA +o(x), (1—-x) /2=1+ Set à? + o(x?) 


Pratique des développements limités 
Pour calculer un développement limité po + pi(x—a) +:::+ pa(x—a)" + o[(x—a)"| 
au point a, il est commode de se ramener au point 0 en posant X = x — a. 


Exemples 
a) Cherchons le développement limité de l'en un point a Z 0. On pose X =x-—a 
T 


au point X — 0. À l’ordre 2 par 


et l’on calcule le développement limité de .. 
a 
exemple, il vient 
1 1 1 1 X 


… _ 1 X? … 1 X X? 
a+X  al+X/a a a + a + o(x°) F “Li a + o(X”) 
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r=i Z ( ur a)” + o[(x — a)°] 


b) Pour trouver le développement de cosx à l’ordre 2 au point x = 71/3, posons 
X =x-—7/3 et développons cos(r/3 + X) au point X — 0 à l’ordre 2. Puisque 
cos 7/3 = 1/2 et sin r/3 = V3/2, il vient 


cos(r/3 + X) = L cos X V3 sin X 


[1 > x?) V3 x + o(x9 


2 
1 
2 
_ 1 V3 % 1 x2 + OX?) 
2 4 
1 
2 


2 
V3 (2 r/3) — L(a-x/3) +o[(x-x/3)] 
Somme. On peut évidemment ajouter ou soustraire deux développements limités 
au même point et l’ordre du résultat est le plus petit des ordres employés. 

Par exemple, au point 0, on a 


sinx =æ— Lyÿ+ x +o(x°) et tan a = æ + 22 + o(x°) 


6 120 
donc tan x — sin x = (1+1) x$ + o(x°) — A + o(x°). C’est le résultat qu'indique 


le tableau de valeurs page 265. 


N 


Produit. Pour trouver le développement à l’ordre n au point 0 d’un produit 
f(æ)g(x), on écrit les développements limités de f(x) et g(x) à ce même ordre n et 
l’on multiplie les parties polynômes en négligeant les puissances de x supérieures à 
n. Par exemple, on a 


ee =l1+z+ De + aa + (x) et cosx = 1 — 32 + (x) 


e° cos x = [1+a+ ; a+ : a] [1 Dr] +o(x*) (produit des parties polynômes) 


= LHatoa+saf#[l + x] [- Le] +o(x*) (suppression des ordres > 3) 


= 1+x- 22° +o(x) 


Composé. Supposons que z = g(y) et y — f(x) ont des développements limités 
z=Q(y)+o(y") et y= P(x)+o(x") au point 0 et que l’on a f(0) —0. Cette dernière 
condition se traduit par le fait que le terme constant du polynôme P est nul. Pour 
obtenir le développement de z — g( fi (x)) à l'ordre n au point 0, on remplace y par 
P(x) dans le polynôme Q(y) en négligeant les puissances de x supérieures à n. 
Cherchons par exemple le développement à l’ordre 3 de z = /cosx au point 0. 
On pose y = cosx — 1, donc 2 = /cos x = /T + y, et l’on a bien y —0 quand x — 0. 
1 


y=—ia+o(e) et2=1+ y Lu +o(?) 
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Puisque y? FLE on à y — o(x°), donc aussi o(y?) — o(x*). En remplaçant dans 


le développement de z, on obtient 


Vcos x = 2 = 1+ ; ( Dr) + o(x°) =1-— La? + o(x) 


Recherche d'une partie principale et calcul de limites 


Quand x tend vers une valeur a. Si l’on a un développement limité de f(x) 
en un point a, alors f(x) est équivalent au premier terme non nul de ce dévelop- 
pement. 


k 


En effet, si le premier terme est px(1—a)", alors f(x) — px(x—a)" est une somme de 


fonctions négligeables devant (x—a)". 


Quand x tend vers l'infini. On prend t — L comme variable : alors f(x) est 


une fonction g(t) et l’on calcule le développement limité de g(t) quand t tend vers 
0 par valeurs positives si x tend vers +00, par valeurs négatives si x tend vers —0o. 


Exemples 


a) Quelle est la partie principale de f(x)=Vx?-ax-—Vx?—bx quand x tend vers +00 ? 
Supposons a £ b, sinon f(x) =0. Quand x tend vers +0, la partie prépondérante 


de Vaÿ—ax est Vx$ = xx : on met donc x4/x en facteur, d'où 
f(x) = xvz [VI — a/x? — V1- rx?) = xVzu(x) 


En posant x — 1/t et en utilisant les développements limités de Y1+#? et de 
V1-t en 0 (tableau page 303), il vient 


2 2 D. ; - 
u(x)= V1—at2 — /1—bt2 = (1 ai )-(1 bi }+o(t2)= ? 2240) b—a 2 
2 2 2 t—0 2 
b—a b—a 
TX DOVE —7> —= 
f( Le 2 2 2/x 
ét: : b—a 
On en déduit lim f(x) = lim _ 
æ—+00 fa) æ—+oo 2,/% 
1 


b) Cherchons la partie principale de f(x) = _— quand x tend vers 0. On a 
T 
f(æ) = TSNE ef l'on sait que (x—sinx) + 2°, On en déduit f(x) = hi = 
| æ sin xæ—0 6 x—0 xsinxT 
TT _X TZ carsinx + x.En conséquence, f(x) tend vers 0 quand x tend vers 0. 
6 sinx x—0 6 z—0 ‘ 


sin x 


Exemple. Pour un certain cocktail de médicaments, on sait que la quantité q de 
produit actif dans le tissu cible se stabilise puis décroît en fonction du temps selon 
une loi de diffusion de la forme q(t) = ae-%* +be-ft, où B > a > 0. 

Un des problèmes en Biométrie consiste à estimer les constantes positives a, «, b et 
B en effectuant des mesures de q(t). 
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B 
Quand t devient grand, be-/! est infiniment petit devant ae ®* : en effet, =———ela-#)t 
€ 


—at 
tend vers 0 quand { tend vers +00, car nous avons supposé a—f < 0. On a donc 


at), à ae-%, Puisque q(t)=ae-%[1+(b/a)e(-#)], il vient en prenant le logarithme 


Inq(t) =-at+na+In[1+u(t)], où u(t) = (b/a)eta-#i, 

Comme u(t) tend vers O0 quand + tend vers plus l'infini, In[1 + u(t)] aussi, et 
Inq(t) = (-at+lna). 

t—+00 
Après un certain délai qui dépend de l’ordre de grandeur (connu) des coefficients, 
Inq(t) se comporte comme la fonction affine —at+1n a. Pour calculer une estimation 
de —a et de Ina, on effectue des mesures de q1,q,... à des instants t;,{:,... et 
l'on cherche la fonction affine qui approxime le mieux la relation entre les t; et les 
qi = q(ti) : la solution est la droite de régression (page 211). 
Après qu’on ait ainsi déterminé les nombres a et Ina (donc aussi le coefficient a), 
on considère 


r(t) = q(t)- ae %=be Ft, Inr(t) = -Bt+mb 


et les mesures t;, Inr; — n(qg—ae %), En calculant la droite de régression relative 
à ces données, on obtient les nombres —B et Inb (voir l'exercice 4). 


Application à l'étude d'une fonction au voisinage d'un point 


Soit f une fonction continue ayant au point a un développement limité à l’ordre 2 : 


f(æ) = po + p1(x—a) + pa(x—a)* + o[(x—a)*] 


Proposition 

a) On a po = f(a) et p1 = f'(a). 

b) L'équation de la tangente en à est y — po + p1(x — à). 

c) Au voisinage de a, la courbe est au-dessus de sa tangente en a si p2>0, en-dessous si p2<0. 
Le membre de droite tend vers po quand x tend vers a; comme la fonction est 
continue en a, f(x) tend vers f(a), donc po = f(a). 
On a alors (f(x)—f(a)) + pi(x — a) et par défini- 
tion, f'(a) = p1. L'équation de la tangente est donc bien 
y = Po +p1(x — a). Soient M et T les points d’abscisse x f(x) 


sur le graphe de f et sur la tangente en à. Si ps £0,ona 
TM = f(x)—y = po(x — a)?. Pour x voisin de a, TM 


a donc le signe de p2(x — a)?, c'est-à-dire celui de p2. | 


Si f est deux fois dérivable, on sait qu’en tout point a, le coefficient p> du 
développement limité est ; f'(a). On en déduit : 


Si f(x) > 0 pour tout x, alors en tout point, le graphe de f est au dessus de sa tangente. 


Si f(x) <0 pour tout x, alors en tout point, le graphe de f est en dessous de sa tangente. 
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Majoration de l'erreur dans l'approximation affine 


Pour une fonction deux fois dérivable, on a une égalité des accroissements finis à 
l'ordre 2 : 


f(æ) = f(a) + (x-a)f'(a) + OT où c est entre a et x. 


L'erreur commise en x quand on remplace f(x) par son approximation affine au point a 


T—a À 
est moindre que M! | , où M est un majorant de EMO] quand t décrit l'intervalle 
d'extrémités a et x. 

(a) 


En effet, sur la figure précédente, on a TM = | f(x) — yl = EMOIE 


Résolution d'équations par la méthode de Newton 


Dans les applications, on rencontre le plus souvent des équations qu’on ne sait pas 
résoudre de façon exacte. Il faut alors disposer de méthodes permettant de trouver 
une bonne valeur approchée de la solution. La méthode de Newton est l’une des plus 
employées pour résoudre une équation f(x) = 0 lorsque la fonction est suffisamment 
régulière. 

Précisément, supposons que f a une dérivée seconde continue et que f'(x) Æ 0 sur 
l'intervalle où l’on cherche la solution. 


ss : . : T : 
Principe de la méthode. On considère la fonction N(x) = x — ë et la suite 
HA 
itérative zh41 = N(x,), c'est-à-dire 
x 
En11 = Tn — # n) , où æ est une valeur initiale donnée. 
F'(n) 


Un nombre s est solution de l’équation f(x) —0 si et seulement si N(s) — s, autre- 

ment dit : les solutions de f(x) —0 sont les points fixes de N. Si la suite (x,) a une 

limite, cette limite est un point fixe de N, donc une solution de l'équation f(x) — 0. 

l'a? = f@)f"@) _ ff") 
f(x) f'@Y 

Pour x voisin de s, [N'(x)| sera voisin de 0 et en tout cas inférieur à un nombre 

positif K < 1. D’après l'inégalité des accroissements finis, on aura donc 


ln — 5 = Nan) — N(s)| < Kiæn — sl 


On a N'(x) =1 donc N'(s) = 0 car f(s) = 0. 


pour %A assez proche de s. Aïnsi la fonction N est contractante au voisinage du 
point fixe s. Le point fixe est attractif et la suite (x,,) tend vers s (page 263). 

Mais puisque N'(s) = 0, le coefficient X est d'autant plus petit que x, est proche 
de s, donc le point fixe est très attractif et la suite (x,) converge très rapidement 
vers 8 : c’est cela qui fait l'intérêt de la méthode de Newton. 
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Interprétation géométrique. Au point initial xo, la tangente au graphe de f a 
pour équation y= f(xo)+f'(xo)(x—20). Puisque f'(x0)0, 

cette tangente coupe l'axe des abscisses au point x tel que YA 
(0) — 
f'(æo) Ê 


0= f(xo) + f'(xo)(x—x0), c'est-à-dire en x1 = 10 — 


N(xo). 

On voit maintenant comment construire les itérés x, : 
la tangçente au graphe de f au point d’abscisse 
æn coupe l'axe des abscisses en zh+1. NE SE 


Exemple. Soit f(x) = 41° — 112? +15x — 14. On a f(1) = —-6 <0 et f(2)=4>0, 
donc l'équation f(x) = 0 possède une solution s entre 1 et 2, d’après le théorème 
des valeurs intermédiaires. 

Prenons %9 — 2,5 comme valeur initiale. Le tableau ci-dessous montre les premières 
valeurs x, de la suite de Newton. Il est visible que cette suite a pour limite 1,75 et, 
dans cet exemple, on a effectivement f(1,75) = 0 : le nombre s — 1,75 est solution 
exacte de l’équation. 


n Th En | décimales exactes 
0 | 2,500000000000000000000000000 | 0,75 0 
1 | 2,007142857142857142857142857 | 0,20 0 
2 | 1,791552915934118533759009012 | 0,04 1 
3 |1,751265118850405510535778693 | 107 * 2 
4 | 1,750001206860097353452187869 | 107 5 
5 | 1,750000000001099252866066046 | 107 !? 11 
6 | 1,750000000000000000000000912 | 1077 24 


Le nombre e,, est l'erreur commise en remplaçant s par x,, autrement dit e, =%n —s 
(on ne connaît bien sûr de e, que des valeurs approchées). 

Dans le tableau, on voit qu’en passant de x,, à x,.1, le nombre de décimales exactes 
est au moins doublé, de sorte que la convergence est très rapide. Nous allons voir que 
c'est une propriété générale des termes x, de la suite de Newton, pour n assez grand. 


fs) 


En+1 


Proposition. Posons en — Zn — 8. Quand n tend vers l'infini, —>— tend vers 2)" 
ei 5 
Démonstration. On a N'(x)— SU et puisque f(s)=0, f(x) = f'(s)(x—-s)+o(x—s). 
LT 


Quand x tend vers s, f'(x) tend vers f'(s) Z0, f(x) tend vers f”(s), donc N'(x) = 


Pere + (x —s)o(x —s). En intégrant, on obtient N(x) — s = N(x) — N(s) = 
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1 f"(s) 2 2 nn N@)=s fs) | 
= xæ—s)"+ol(x—s)"|, d'où lim L .On a Nr») =Ztn11 et limx, =5, 
2 f'{s) ( ) [ ) ] FAR (x . s)? 2f'(s) ( ) +1 
_ 1! 
done re - tend vers f Is) ; = 
(Zn — 5) 2f'(s) 
Pour fixer les idées, supposons que |f"(s)/2F/(s)| est de l’ordre de l'unité. À partir du 
rang n tel que |e,| soit de l’ordre de 107 !, |e,41| sera de l’ordre de (1071)? — 107 ?, 
len+2| de l’ordre de (102)? = 10-#, et ainsi de suite : à partir de ce rang n, le nombre 
de décimales exactes est en principe doublé quand on passe de x, à 7h41. 
Remarque 


Dans la méthode du point fixe pour une fonction contractante, nous avons montré 
que l'erreur diminue comme k", où k < 1 est le coefficient de contraction de la 
fonction au voisinage du point fixe (page 263); si par exemple k est de l’ordre de 
1/10, on finit seulement par gagner une décimale à chaque itération. On voit que la 


suite de Newton converge beaucoup plus rapidement. 


Précautions d'emploi. Il est important de choisir une valeur initiale xo suffi- 
samment proche de la solution, faute de quoi la suite peut tendre vers l'infini, ou 


générer un cycle, ou devenir erratique. 


On commence donc en général par estimer grossièrement la solution, afin de prendre 


xo pas trop différent de s. 


Cependant, supposons par exemple que pour x >s, on a f(x) > 0 et f' strictement 
croissante, comme sur la figure page 308 (la condition f’ croissante se traduit par le 
fait que le graphe est au dessus de ses tangentes). Pour toute valeur initiale x6 > s, on 
a alors s < æ1 < x0, donc aussi s < 2 < x et ainsi de suite : la suite (x,) est décrois- 
sante, minorée par 5, donc elle converge. Sa limite doit être une solution de l'équation 
f(x) = 0, et comme on a supposé f(x) > 0 pour tout x > s, la limite est s. De même, 
si f(x) et f/(x) sont négatifs pour tout x > s, on peut choisir x > s quelconque. Ces 


conditions sont notamment satisfaites dans le cas suivant. 


Si f est une fonction polynôme ayant toutes ses racines réelles et si s est la 
plus grande racine, la suite de Newton initialisée en x0 > 8 a pour limite s. 
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4. Courbes paramétrées 


Dans un plan muni d’un repère (O;i,j), considérons un point M dont les coor- 
données dépendent d’un paramètre t : en notant M{t) la position du point pour la 
valeur t du paramètre et x(t),y(t) ses coordonnées, on a donc 


OM(t) = x() à +y(#)j 


Quand t varie dans un intervalle, le point M(t) décrit une courbe, appelée courbe 
paramétrée. Les fonctions x(t) et y(t) s'appellent les fonctions coordonnées de la courbe. 


Exemple 1. Si les coordonnées x(t) et y(t) sont des fonctions affines, de la forme 
a(t)=at+b, y(t)=ct+d avec a0 et cZÆ0, alors M(t) décrit une droite. En effet, en 
éliminant { entre les égalités x—at+b et y=—ct+d, il vient cx —-ay=cb—ad, qui est bien 
l'équation d'une droite D. Réciproquement, pour tout point M € D de coordonnées 


(x,y), on a a(y—d)=c(x—b), donc en posant {— _ il vient x=at+b et y=ct+d. 
a 


Exemple 2 : l'ellipse. Posons x(t) = acost et y(t) = bsint, où a >0 et b>0. Puis- 
qu'on a l'identité (cost)? + (sint}? — 1, l'équation de la courbe 
est : (x/a)? + (y/b}? = 1. À nouveau, pour trouver l'équation, 
nous avons éliminé t entre les expressions x(t) et y(t). La 
courbe est une ellipse de centre l’origine et d’axes Ox, Oy. 
Quand t décrit [0,27{, l’ellipse est parcourue une fois; quand 
t décrit R, elle est parcourue une infinité de fois. Si a = b, on 
obtient simplement un cercle de rayon a. 


Exemple 3 : la cycloïde. Faisons rouler sans glissement un cercle C' sur une 
droite D. Considérons un point M lié au cercle : au cours du mouvement, la 
trajectoire de M est une courbe appelée cycloïde. 

Cherchons une équation paramétrique de la cycloïde. Pour cela, prenons comme axe 
des abscisses la droite D orientée dans le sens du mouvement et choisissons le repère 
orthonormé direct. Pour simplifier, supposons qu'à l'instant 
initial, le point de contact du cercle et de la droite est à l’origine. 
Le paramètre est l'angle 0 dont a tourné le cercle. Notons r le 
rayon du cercle, w son centre et T son point de contact avec D. 
Puisque le roulement est sans glissement, la longueur OT est 


égale à la longueur r0 de l’arc TM du cercle. Le point w décrit 
une droite parallèle à D à la distance r : si l’on suppose que C' est dans le demi-plan 


supérieur, l’ordonnée de w vaut donc toujours r. On a OM = OT + Tw +wM, 
OT = rfi, Tw = rj et wM = (—rsin@)i+(-—rcos0)j, donc 


OM(t) = r(0 — sin @) à +r(1 — cos 0)j 


Les fonctions coordonnées sont x(0) — r(0 — sin 0), y(0) = r(1 — cos O). 
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Comme on ne peut pas, de façon simple, tirer © de l’une des équations et reporter 
dans l’autre, on étudie les propriétés de la cycloïde au moyen des deux fonctions 
0 x(0) et 0 + y(8). 


4.1 Tangente, longueur, courbure 


Tangente en un point d'une courbe paramétrée 


Soit M(t) = x(t)i+y(t)j une courbe paramétrée dont les fonctions coordonnées 
x(t) et y(t) sont dérivables. Soit {y une valeur du paramètre et Mt) le point 
correspondant. Les approximations affines 


z(t) = x(to) + &'(to)(é — to) + o(é — to) 
y(t) = y(to) + y'(to)(é — to) + ot — to) 
s'écrivent vectoriellement sous la forme 


| OM(t) = OM(to) + (t — to) HA +o(t = tr) 


où o(t — ty) désigne un vecteur dont les deux coordonnées sont négligeables devant 


t—to quand { tend vers t5. On pose 


dOM de ee ee 
a Co) = Go) + (o)j = æ'(to) à +y (to) 
dOM , 2 
Le vecteur dE (to) s'appelle le vecteur dérivé de OM(t) en to 
Définitions 


Si le vecteur dérivé en { n’est pas nul, on l’appelle vecteur tangent en M(to) à 
la courbe. La tangente en M(to) est la droite passant par M(to) et de direction le 
vecteur tangent. 

Si le vecteur dérivé est toujours non nul, on dit que la courbe est régulière. 


Un point T de coordonnées (x,y) est sur la tangente si et seule- 


ment si le vecteur M(t)T est colinéaire au vecteur tangent. En uti- 


lisant le déterminant, cela se traduit par det (a (to)T, our (to)) = 


0, d’où l'équation de la tangente : 


—x(to) x'(t 
on 


=0 


Si le vecteur dérivé est nul, on fait une approximation au second ordre en calculant le vec- 


dOM(t) _Px,, =, À 
de @_ nn (to)i+ a (to)1=x"(to)i+y"(to)3. Puisqu’on a alors 


at) = r(to)+2"(to)(t-t0)?+o[(t-to)?] et y(t) = y(to)+Y/(to)(t-to)?+o[(t-to)?], 


teur dérivé seconde 
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la tangente en Mt) est dirigée par ce vecteur dérivé seconde, s’il n’est pas nul. Plus 

généralement, le premier vecteur dérivé non nul en M{(t5) donne la direction de la 

tangente en ce point. 

dOM 
dô 

et ce vecteur dérivé n’est nul que si 0 = 2k7, où k € Z. En tout point M(6) tel que 


0 4 2rZ, la cycloïde a une tangente. Quand 0 = 7, 37, etc, la tangente est horizontale, 
car sin 0 = 0 : cela correspond aux positions hautes du point M. 


Exemple. Pour la cycloïde (exemple 3 page 310), on a = r(1— cos 0) à +r sin 0j 


(8=0) À (0 —2r) (8 = 47) 5 


Pour 0=0,27,4r,..., le point M est sur D et le vecteur dérivé est nul. Puisque 
x”(0) = rsin0 et y”(0) = rcos6, le vecteur dérivé seconde en ces points est rj, donc 
la tangente est verticale (points © et À sur la figure). Comme (0) est toujours 
positif ou nul, ce sont des points de rebroussement : les deux branches de la courbe 
y ont la même tangente. 

Vecteur vitesse, vecteur accélération. Dans notre exemple, le cercle est en mou- 
vement, donc l'angle 4 est une fonction O(t) du temps. Le vecteur dérivé Iuèt 
s'appelle le vecteur vitesse. En notant ô = es on a (dérivée d’une composée) 

dOM _ dOM; 
dt dô 
Ainsi le vecteur vitesse est tangent à la courbe et sa direction indique le sens de 


2 
ee 2 dérivé seconde par rapport au temps, s'appelle vecteur 


parcours. Le vecteur 
accélération. 


Longueur d'un arc de courbe 


Supposons désormais que le repère (O;i,j) est orthonormé et que les coordonnées 


x = x(t) et y = y(t) sont dérivables. éd 


A partir du point M(t), donnons au paramètre un petit accroisse- 

ment ôt > 0 et approchons l’arc de courbe entre M(t) et M{t+ôt) y'(t)ôt 
par le segment de droite M(t)M(t+ ôt). En négligeant les quan-  37(4) 
tités infiniment petites devant (ôt)?, les coordonnées de M{(t + ôt) 

sont t(t + ôt) = x(t) +x'(t)ôt, y(t + €) = y(t) + y'(t)ôt et le carré approximation 
de la longueur du segment M(t)M(t+ ôt) est Hi premIer pate 


Le(e + 66) — 2(9)]" + [utt + 66) — y(0)]° = [x (06€]” + [y/(b6t] 
= [x (6)? + y'(6)?] (64)? 


x/(D6t 


2 
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En notant ds la différentielle de la longueur de l'arc, il vient 


ds = \/x'(t}? + y'(t)? dt 
Cette relation entre les différentielles ds et dt s'écrit _ = 4/x'(t)? + y'(t)? : elle 
exprime la dérivée de la longueur d’un arc. 
On démontre que ce raisonnement par infiniments petits est valable pour une courbe 
régulière dont le vecteur tangent dépend continûment du paramètre. Dans la suite, 
nous supposerons toujours qu'il en est ainsi. 


Définition 
Choisissons un point Mo = M(to) de la courbe comme origine des arcs. Pour 


tout point M = Mt), la longueur s(t) de l'arc MM a pour dérivée n = 


4/x/(t)? + y(t)?. Pour tout point Mi = M(t1), la longueur de l’arc MoMA est donc 
s(ti) = [ a'(t)? + y'(t)? dt. 
to 


La longueur de l’arc est comptée positivement si #1 > to, négativement si #1 < to. 


Exemple : longueur d'une arche de cycloïde. Puisque nous avons choisi un 
repère orthonormé pour calculer les fonctions coordonnées de la cycloïde, on a 


z'(0)? + y/(0)? = r?(1 — cos 0)? + r?(sin 9)? = 2r?(1 — cos 8) = 4r? [sin(9/2)}° 
: = 1/x/(0)? + y(0)? = 2rsin(9/2) , pour 0 < 0 < 2x. 
Prenons le point © (to = 0) comme origine des arcs. Si M(8) est un point de l’arche 
OÀ (figure page 312), alors 0 est entre 0 et 2r et la longueur de l’arc OM(6) est 
5(0) = 2r A sin(u/2) du = 2r |-2 cos(u/2)]. = 4r[1 — cos(9/2)] 


Pour 0 = 27, on trouve que la longueur de l'arche OZ est 8r. 


L'abscisse curviligne 

Il est naturel de paramétrer les points M] de la courbe par la longueur s de l'arc 

MM. Cela est possible, car la fonction longueur est strictement croissante (nous 

avons supposé que x’(t) et y/(t) ne sont jamais nuls en même temps, donc _ est 

strictement positif). Ainsi s et { sont fonctions l’un de l’autre et les coordonnées x 

et y des points de la courbe sont aussi des fonctions de s. On dit que le paramètre 

s est l’abscisse curviligne de la courbe. 

On dérive les coordonnées par rapport à l’abscisse curviligne au moyen des formules 

1 | 

RE 
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Il vient alors 


(e+ (2) = po +von (2) =: 


Avec l’abscisse curviligne comme paramètre, le vecteur tangent est 


dOM _ dx; ". 
ds ds ds 
Puisqu’on a supposé que le repère est orthonormé, le carré de la norme euclidienne 


est la somme des carrés des coordonnées ; d’après la formule précédente, on a donc 


dy - 
2; 


dOM 
ds 


Le vecteur s'appelle le vecteur tangent unitaire. 

Courbure 

On mesure la courbure d’un arc de courbe MM en comparant l'angle à fait par 
les tangentes en M et M' avec la longueur L de l'arc : la courbure moyenne de 
l'arc est par définition le rapport a/L. 


D'après nos hypothèses, la courbe possède en tout point A/(f) un vecteur tangent 


Par. Notons 4 l'angle entre l’axe Ox et la tangente en M, plus précisément l'écart 


angulaire des vecteurs i, ee (t) (définition page 225). 
Si M' = M(t') est un autre point de la courbe, l’angle des vec- 
teurs À. dOM (t) est 4’ et l’angle des tangentes est 4 — w. 


Choisissons un point M, de la courbe comme origine des arcs : 


les arcs MM et MoM" ont des longueurs s et s’, la longueur de l'arc MM" est s! —s 


— Ê. Quand M’ tend vers M, la courbure moyenne a 
— 5 


et sa courbure moyenne est - 


d É 
donc pour limite D si cette limite existe. 


Supposons que les fonctions x(t) et y(t) sont deux fois dérivables. 


Définitions à 

La courbure au point M est K — _ où 4 est l'écart angulaire des vecteurs 
+ s 

i, JOM | Gi la courbure en M n’est pas nulle, le nombre 1/|K| s'appelle le rayon 


de courbure en M. 
Intuitivement, une courbure nulle en un point correspond à un «rayon de courbure 
infini », c'est-à-dire à un arc «plat» en ce point. 


Exemple. Dans le cas d’un cercle de rayon R centré à l’origine (exemple 2 page 
310), la tangente au point M de coordonnées (x,y) = (Rcost, Rsint) fait l’angle 
w$—=t+7/2 avec l’axe Ox. En choisissant (0) comme origine des arcs, on a 
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de d(t + 7/2) si 


! 8 Rdt R 
en un point d’un cercle est donc le rayon du cercle. 


s(t) = Rt, donc la courbure en M est . Le rayon de courbure 


Calcul de la courbure. Notons T — sou le vecteur tangent unitaire au point 
S 


M. Puisque le repère est orthonormé, il s'écrit T = cos pi + sin pi, où @ est l'angle 
EN . On a donc 
dx dy 
at — EE 
de + 
Le vecteur N = cos(ç + 7/2) à +sin(ç + 7/2)j = — sin à + cos pj, orthogonal à T, 
s'appelle le vecteur normal en M. 


= sing 


- Le vecteur normal N est de norme 1 et la base (T, N ) est orthonormée directe. 


La droite passant par M et orientée selon N s'appelle la normale principale ; elle 
est orthogonale à la courbe en M. 
Dérivons le vecteur T par rapport à s. Il vient 
aT de = dy: N 
= PR Nr 
ds ds” 1 RP) ds? 


Par définition de la courbure, on en déduit : 


sin 4) 


la courbure en M est le nombre K tel que _ = KN 
s 


Ainsi, la courbure en M est la mesure algébrique du vecteur 
_. sur la normale principale. 
S _ 


Le vecteur TL est toujours dirigé vers l’intérieur de la courbe. 


Si la courbure en M est positive, le vecteur normal pointe lui- 
aussi vers l’intérieur de la courbe; si la courbure est négative, 


le vecteur normal pointe vers l'extérieur. 


Sur la figure, la courbure est négative en M et positive en P. 


dOM 


Exemple. Dans le cas de la cycloïde, on a =r(1-cos O)i +rsin{j et en suppo- 


sant 0 < 4 <27, on sait que ds — 2rsin(0/2) d0. Calculons le vecteur tangent unitaire. 


= _ dOM __ dOM dû _ "(1 — cosb) - rsin® ©. = = 
dl ds dû ds 2r sin(0/2) É 2r sin(0/2) sin(9/2) à +cos(9/2)j 


Le vecteur normal est N = — cos(9/2) i +sin(4/2)j et 


dT _ dT d@ | 
ds d0 ds 


1 3 lé E 1 1 

0/2) i—= 0/2 = N 
g C0S(8/2) 6 Sn] 57e — — 4rein(0/2) 
ue 
4r sin(0/2) 
minimum au sommet de l'arche (0 = x). Remarquons qu’en un point d’ordonnée 
quelconque y = r(1— cos 0) > 0, la courbure est K — —1/,/8ry. 


Au point M(0), la cycloïde a pour courbure K = — . La courbure est 
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Cas d'une courbe y — f(x) 


Chaque point du graphe de f a pour coordonnées (æ, f (x)), donc est repéré par 
son abscisse : le graphe d’une fonction de x est une courbe paramétrée par x. 


- Si f a une dérivée continue, le vecteur tangent au point M(x) a pour coordonnées 


de 1 4 2 na = (0: 

. dl EL + far" 

Si f(x) 0, le rayon de courbure en M(x) est FF 
TX 


Si f(x) = 0, la courbure en M(x) est nulle. 


On voit que la courbure ne dépend que des deux premières dérivées de f. 


4.2 Application aux bretelles de raccordement 


Il s'agit de trouver la forme d’une voie routière de raccordement entre une ligne 
droite (courbure nulle) et un arc ayant une courbure non nulle. Ce problème se pose 
pour le tracé d’une ligne ferroviaire ou d’une sortie d'autoroute : si en sortant d’une 
ligne droite, on emprunte immédiatement une trajectoire de rayon de courbure À, 
l'accélération normale d’un véhicule roulant à la vitesse v passe brutalement de 0 à 
v?/R, ce que l’on cherche à éviter. 

Dans le cadre autoroutier, on suppose habituellement que pendant le changement de 
direction, le conducteur roule à une vitesse constante v et imprime au volant une 
rotation régulière, de sorte que l’angle de braquage des roues est proportionnel à la 
durée du mouvement. 


Entre des instants voisins { et { + dt, le véhicule a tourné d’un angle dy = adt, 
où « est proportionnel à l’angle de braquage. 

En prenant comme instant initial 4 — 0 celui où le 
véhicule quitte la ligne droite (point O), on a alors 


2 d 
a=at, où a est une constante positive, donc . = at. 


y A 


Notons s l’abscisse curviligne de la courbe comptée M 
à partir du point O (s = 0 si t — 0). La vitesse du Nm 
ds 1 > 

T 


véhicule à l'instant { est im v, donc 5 = vt. O 


En tout point de la courbe, la courbure est K 


dp __dp dt _ at 


ds dt ds U 
est nulle à l'instant initial et varie proportionnellement à la distance parcourue. En 


notant À = 1/K le rayon de courbure, il vient 
Rs = v?/a 


Cette relation caractéristique de la courbe exprime que le rayon de courbure est 
inversement proportionnel à la distance parcourue. 

Prenons un repère orthonormé d’origine O, l’axe Ox étant la ligne droite et l'axe 
Oy étant dirigé vers la sortie. L’angle & entre Ox et le vecteur tangent à la courbe 


. | d if : 
est l’angle dont a tourné le véhicule. Puisque _ — LS, il vient @ = DS” d’où 
S UV UV 


@ 
, 5 ; cette valeur 
v 
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de = cos = cos[(a/2v?)s] et : = sinçg = sin[(a/2v°)s°] 
s s 


En intégrant, on trouve les fonctions coordonnées x(s) et y(s) de la courbe. Puisque 
æ = y = 0 quand s — 0, on obtient ainsi la paramétrisation 


x(s) = | cos((a/2v”)u”) du et  y(s) = | sin((a/2v*)u”) du 


En général, on impose l'angle + dont la courbe permet de tourner, ou bien son 
rayon de courbure Rx à l'extrémité. La longueur ZL de l'arc est alors donnée par 
les relations max = (a/2v?)L? où RmaxL = v?/a. L'extrémité À y 

de la bretelle de raccordement a donc une position déterminée, 

de coordonnées de x(L),y(L). 


Ces intégrales (dites de Fresnel) ne s'expriment pas au moyen 

des fonctions usuelles; pour dessiner la courbe, appelée spirale 

de Cornu, il faut faire un calcul numérique approché de x(s) et O 
y(s) (voir le chapitre 11). 


T 


une spirale de Cornu 


Calcul de primitives 


Il est utile de savoir calculer quelques types courants d’intégrales. Rappelons les 
règles essentielles : 


_ d f(t) dt = F(b) — F(a) si F est une primitive de f. 
Si à et 5 sont des constantes, Jlaf(® + Bg(t)]| dt = a [#(0) dt + 8 [a(e) dt. 


5.1 Méthodes générales 


On dispose de quatre méthodes générales pour calculer une intégrale I = Î f() dt. 


La fonction à intégrer est une dérivée connue 
Exemples 

1 f(at+5)dt= 1 

a(a+1) 

La dérivée de (ax + b)*+1 est en effet a(a+1)(ax + b)*. 


(ax + b)%#1 si à Z —1 et a Z 0. 


. _ 1(t 
2) J tant dt — J _… dt =) cest ) dt = — In|cos 2. On en déduit par exemple 


[tant dt = [In cosx]7/* =(M2)/2. 


3]On a Î (tant)? dt = tan x — x, car la dérivée de tan x est 1 + (tan x)°. 
u'(t) 

ai= ft ge f- 2% ge 
TE Er É u(t) 
le signe intégrale est la dérivée de /u(x), donc 1 = Va+x?. 


dt, où u(x) = a+2x?. La fonction sous 
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Décomposer en somme 
C'est ainsi que l’on peut calculer les intégrales Î (cost)" dt et | (sint)”" dt pour n entier 


positif. Par exemple, grâce à la formule cos2x = 2(cos x}? — 1 = 1—2(sinx)?, il vient 
2 (cost) at = fa + cos 2t) dt = x + Jeos2tàt =x+ : sin 2% 


Nous allons voir que (cosx)” est une somme de fonctions cos kx, où les nombres 
k qui interviennent sont des entiers positifs ou nuls au plus égaux à n. De même, 
(sin x)" est une somme de fonctions sin kx. 


Faisons un calcul dans les nombres complexes en introduisant 2 = e*° = cosx+isinx. 


1 it 


Puisque 2 —e ** = cost —isinr, on a 


2cosr=2z+zl et 2isnr=z-z!. 


En élevant par exemple à la puissance 4 par la formule du binôme (page 61), on obtient 


A\ . 4 ; 4 , 
Pcosx) = (2+x 1) = 2 + (1) az + (:) x ?+ (:) 2x +24 
= +42 +6+47 +2 4=(/+42 4944242946 
D'après la formule de Moivre (page 37), 2? =cos2x +isin2r et z ?=cos2r—isin2r, 
donc 2? + 2 ? — 2cos2r. De même, 24 + 2 1 — 2cos4x, donc il vient 24(cos x) — 
2 cos 4x + 8 cos 2x + 6, ou encore 


(1) (cos x)* — : cos 4x + ; cos 27 + : 


En intégrant, on obtient 


4 y 1 1 3, sin4r , sin2r , 3x 
J (cos dt = L feosatät+ E feos2t dt + 3x 92 + ! + 8 


Pour l'intégrale de (sinx)*, écrivons (z— 2-1) = (2isinx)* = —% i(sinx)*, puis 
—8i(sinr) = 2-32 149222 8 8 924871 8 
= (#3 %)-3,(2-21 


Puisque 2°=cos3x+isin3x et z *—cos3x—isin3r, on a —8i(sinr)—2isin3r—3(2isinr), 


d’où 
(2) (sin x)? ___sin3r dE 3 sin x 
4 4 : 
: 3 __ cos 3x 3 COS x x/2,. 3 … | cesse 3 COS æ FE 
!. (sint)” dt m + + Î (sin t)° dt 5 à | 2/3. 


Des identités comme (1) ou (2) s'appellent des formules de linéarisation. Elles permettent 
d'exprimer (sinx)” (cosx)”” comme une somme de produits sinprcosqæ. Puisqu’on a 


2 sin px cos gx = sin(p + q)x + sin(p — q)x, 


on peut ainsi en principe calculer une primitive d’un produit (sin x)"(cos x)". 


un 
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Intégration par parties 
La formule d'intégration par parties s'écrit Jutbv'(#) dt = u(æ)v(x) — u()o(e) dt 


Elle est valable pour des fonctions w et v à dérivée continue et signifie simplement 
que la dérivée du produit uv est u/u + uv'. Avec des bornes dans les intégrales, la 
formule devient 


b : b 
[l u(#)v'(#) dt = [u(æ)u(x)]. - | u(t}u(t) dt. 


Par intégration par parties, on peut calculer des intégrales comme . t2et dt, j Intdt, 


Î arcsin t{ dt ou Î arctan t dt. 


Exemples 


1)Dans l'intégrale 1,, — firest dt (où a 0), posons u ={" et v' = e*. Il vient 


uw = nl, v = Leat donc 
a 


n ax 
1, — less ” nt! 1 ect dt = LT € LL PER 
a a a a 


Si n est un entier ne le calcul de 1, se ramène de proche en proche à celui 


2 2 
de L= Je at dt — . On a ainsi 1, — am Lear et D = TT ms à 
a a? a 
2) Pour ea on prend u =Int et v'=t}, donc uw — 1/t et =: il 
: … 1H x*Inx 1 3 _ x Inx …. z* 
vient (In x)? VE dt — " 4 'E dt — Ta. 


3) Calculons le nombre [ Arcsintdt en prenant u = Arcsint et v = 1, donc vu =t 


. On a JArcsint dt = x Arcsinæ — / 


u 
et u! = dt 
vVl- vl-ti 
Dans cette ee intégrale, le numérateur est, à un facteur —1/2 près, la dérivée 
de w—=1—# : 


L 24 w! en 
. n - 7 
Vi-8 2V1-# 2Vw 
On en déduit J Are sin t dt = x Arcsin x + V1 — x? et 
: 1 
| Arcsintdt = [x Arcsinæ], + [Vi a) T 
0 
T T 
= (Z-0)+(0-1=7-1. 
(Z-0)+(0-1=7 


Le dessin ci-contre montre le graphe de Arc sinus et  Ascsinx =y 


nous venons de calculer l'aire grisée. ee - Si 


O æ=siny ZX 


entre le graphe et l’axe des ordonnées est Le sin t dt— 


1 et l’aire totale du rectangle est bien (7/2—1)+1=7/2. 
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Changement de variable 
Supposons que f(t) s'écrit f(t) = glu(t)]u/(t), où g est une certaine fonction. Alors 
si G est une primitive de g, la dérivée de t+ Glu(t)] est glu(t)]u/(t) = f(t), donc 


[ro dt — fout dt = Gu(x)] 


Pratiquement : pour faire le changement de variable u(t) dans l'intégrale, 
on écrit f(t) sous la forme g(u), 


- on calcule du = u'(t) dt et l’on a alors ÎF® dt = J gt) du. 


Exemples 


1) Calculons ainsi l'intégrale Î (cost)"(sint)"" dt lorsque les exposants sont entiers 
positifs et que l’un d’eux, n par exemple, est impair. Posons n — 2p+1 et faisons 
le changement de variable u = sint. On a du = cost dt et 


(cos t)?*l (sin t)" dt = (cost)? (sin t)"(cos t dt) = (1 — u?)? u”" du. 


Intégrons en indiquant en haut du signe intégrale le nom de la variable à utiliser 
dans la primitive : 


Î (cost (sn" dt = | (1 u2)P a du 


La dernière intégrale est facile à calculer car il s’agit d’une primitive de fonction 
polynôme. Il ne faut pas oublier d'y remplacer finalement uw par sin x. 
Par exemple, on a 


| (cos t)*(sint)* dt — Î (cos t)?(sin t)! costdt 
— | (1 — a?) uf du = Ju — u$) du 


uw u7 (sin x) (sinx)’ 
5 7 5] FT 
2) Calculons Fi teŸ dt par le changement de variable u = {?. Puisque du = 2t dt, 


T 2 a 
on a Î ë F(édt) = © / e_" du, donc 


# 2 2 b 2 — —b 
Î te tdt= le ot | te © dt = 
2 a 2 


De même, jee dt= : fée (2t dt)= ; [ ue" du, et en intégrant par parties : 


F 2 2 2 
| Be dt = Lu(-e-t) - 1 / etdu=-2tlee, 
2 2 2 
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5.2 Intégrales de la forme | e%Ÿ cos bt dt ou Î e% sin bt dt 


Introduisons les nombres complexes 
e%Ÿ cos bt + à e%* sin bt = e#Ÿ (cos bt + sin bt) = ettefbt — elarbi}i 


et étendons le calcul des dérivées et des intégrales aux fonctions à valeurs complexes. 
Une fonction à valeurs complexes est de la forme F(x) = U(x) +iV(x), où U(x) 
et V(x) sont des fonctions à valeurs réelles. Définissons la dérivée de F en posant 


F'{(x) = U'(x)+iV'(x), si U et V sont dérivables. 


Proposition. Si À est un nombre complexe, la dérivée de la fonction x + e* est Àe*?. 


Démonstration. Posons À = a+bi, où a et b sont réels, et f(x) = e\* = elatiblz = 
e% cos bx + 1e%* sin bx. En dérivant, il vient 
f'(x) = ae% cos br — be? sin br + i(ae* sin br + be cos bx) 


= e%[(a cos br — bsin bx) + é(a sin br + b cos bx)] 


e%(a + bi)(cos bx + isinbx) = (a+ bijeTeitr = (a +bijettéb)e = XEXT, 


Une exponentielle se dérive donc de la même manière, que l’exposant soit réel ou 
complexe. On en déduit que si À 0, la fonction x+ en est une primitive de e * : 


al dt = 1 eta+bi)z 


a+bi 


En posant u(x) = e% cos bx et u(x) = e% sin bx, il vient donc 


[0 dt + i [ut dt= 1 elatbix = bi e%(cos bx + à sin br) 


a+bi a? + b? 
_ ee [(a cos bx + bsin bx) + (—bcos br + a sin bx) à 
a 
1 oi e"*(a _ _ sin br) Je _ ne : asin bt) 
a +b a + b 


5.3 Intégrale d'une fonction rationnelle 
P(x) 
Q(x)” 
polynômes. Contentons-nous de traiter les cas les plus couramment rencontrés. 
1. Q(x) = (x — a)". Dans l'intégrale Le 
P(t) d= P(u + a) 
(t— a)" u” 


est une somme de puissances positives ou négatives de u. 


Une fonction rationnelle est de la forme où P et Q sont des fonctions 


dt, on fait le changement de 
variable u—=t—a, donc du = dt et 


+ a) 


u? 


du. Puisque P est un 


polynôme, 
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Exemple. Par le changement de variable u = t+1, on a 


3 æ+1 —] 3 
| : sat= | de du= | (u-8+sut -u?)du 
(+1) u 


(x+1)? 
2 


= 3(x+1) + 30x41] + 1 
x+1 


2 
= W _3y+3Inlul + L = 
2 u 


= ————— . En écrivant que x? + bx est le début d’un carré, on a 


P 
Q 2? +bx + c 
a +bx+c=(x+b/2) +d, où d=c—b*/4 est supposé non nul. 


2. 


Pour calculer l'intégrale, faisons le changement de variable u = t+b/2. Il vient 
dt = du, t+p=u+p—b/2 et 


t+ a+b/2 + _ b/2 
Jr à- | - / du= | * du+(p-t/2) | 
É+bt+c u‘ + d u° + d u + d 


— Dans la première intégrale, le numérateur est, à un facteur 1/2 près, la dérivée 


du dénominateur : cette intégrale est donc Sin lu2+d| = > in lr?+bx+c|. 


- Pour calculer la seconde intégrale, on pose d = r? si d >0 et d = —r? sinon, et 


l’on obtient une intégrale usuelle (page 298). 


Ce dt. Puisque x? — 2x + 3 = (x — 1)? +2, on 


pose u = t—1. On a alors 2 + 1 = 2u +3 et il vient 


æ—1 

=, en mil Zu du +3 / ds 

u° +2 u +2 u +2 

= in(u? + 2)-+ 3-1 Arc tan 4 = In(2? — 2x + 3)-+ 3 Arc tan 2 = 


v2 v2 v2 v2 


3. Réduction du degré du numérateur. Supposons que le degré de P est su- 
périeur à celui de Q. Faisons la division euclidienne de P par Q (page 49) en 
appelant Æ le polynôme quotient et À le reste : on a P= EQ +R, où R est de 


degré inférieur à celui de Q, d'où : = E + de 


Puisqu'il est très simple d'intégrer le polynôme E(x), on est ramené à calculer une 


R(x 
primitive de la fraction se où le numérateur est de degré inférieur à celui du 


Q(x) 


Exemple. Calculons 1 = Î 


dénominateur. 


Exemple. Posons f(x)=— La division de x° par x?+1 s'écrit z°=x(x?+1)-x, 


z 
a? +1 


13 _ x? 1 2 
et] dt : > M(x +1). 


d —_ T 
onc f(x) = x FE 
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4. Décomposition en somme. Supposons que Q — AB est le produit de deux 
polynômes n’ayant aucune racine commune (réelle ou complexe). On peut alors trou- 
ver des polynômes U et V tels que AU + BV =1, deg U < deg B et deg V < deg À 
P __PAU+PBV _ PU Fe PV 

AB B A 
Exploitons cela lorsque le dénominateur Q a une factorisation très simple. 


A] Q(x) = (x — a)(x — b),où a £ b. 


Cherchons des nombres u et v tels que = + , c'est-à-dire 
(æ—a)(x—-b) x—-a x—b 
1 


u(x— a)+v(x—b)=1.Il vient u= —v, 1 = —au — bv = (a—b)v, donc v = 
= 


PS PE : — _ LE) 


On intègre alors chaque terme de la somme comme en 1. 
Plus généralement : si Q—(x—a)(x—b)(x—c), où les nombres a,b,c sont deux à 
1 a p ï 


deux différents, on cherche des nombres à,/,7 tels que = = + + : 
Q zx—-a x—-b x—c 


(proposition page 50). Il vient alors 


et 


B) Q(x) = (x — a)(x? + bx + c), où x? + bx + c n'a pas de racine réelle. 
Dans ce cas, on cherche des nombres w, p,q tels que 


1 u PT + q 


(x—a)(x +br+c) T-a r'+br+e 


On les calcule en réduisant au même dénominateur et en identifiant. Alors à est 


la somme d’une fraction de la forme A (cas 1) et d’une fraction de la forme 
D 


G = _—_ Pour cette dernière, en divisant comme en 3 le numérateur par 


a? +bx+c 
le dénominateur, on se ramène à un numérateur de degré inférieur ou égal à 1, 


comme dans cas 2. 


a 


Exemple. Calculons 1 = ’ EE dt. On a 22° +x-3—(x—1)(27+3) et 


le numérateur est de degré inférieur à 2. On peut donc directement chercher des 


nombres u et v tels que 
n = _u 
(c—1)(2&+3) x—-1 2r+3 
c'est-à-dire (2x+3)u+{(x—1)v= x. On trouve 2u+v—1 et 3u—v—0, d'où u—1/5, 


v = 3/5 et I= = nr 1|+ À In [2x + 3]. 


Intégrales généralisées 


Il est parfois naturel de vouloir intégrer sur un intervalle de la forme [a, +oo{ : on 
considère alors les intégrales de a à x et l’on fait tendre x vers l'infini. 
Soit f une fonction continue sur [a, +col. 
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Définition 
Si les intégrales | _f(t) dt ont une limite finie quand x tend vers +0, cette limite 


s'appelle l'intégrale généralisée de f sur [a, +oo![ et se note f(6) dt. 


Dire que f a une intégrale généralisée de valeur vw signifie que, quand x tend 
vers +00, la fonction F(x) = Fi : f(t) dt a pour asymptote horizontale la droite 
d'équation y = v. 


Supposons que a est un nombre supérieur à a; alors l'intégrale généralisée 


+00 +00 
| , f(t) dt existe si et seulement si | f(é) dt existe. 
a a 


En effet, les fonctions + Î : f() dt et x ; : f(t) dt diffèrent de la constante Î ° f(t) dt. 
— Si des fonctions f et g ont une intégrale généralisée sur [a,+o{, alors f + g aussi 
+00 +00 +00 
et [ fO+atbdt= [fo dt+ [7 g(t)dt. 
(0 a a 
En effet, la limite d’une somme de deux fonctions est la somme des limites. 
Pour une fonction continue sur ]—-c,b], on définit de même la notion d’intégrale 


b 
généralisée f f(6) dt : c'est la limite quand x tend vers —c, si elle existe, des 
— 00 


b 
intégrales | f(t) dt. 


Exemple. Un fil AB chargé électriquement crée en tout point P de l’espace un 
champ électrique E dont la direction est dans le plan PAB. Prenons un point P à 
égale distance de À et de B ; en appelant O le milieu de AB, P est dans le plan 
passant par © et orthogonal à AB. Ce plan étant un axe de symétrie de AB, il 
contient la direction du champ. Finalement, E est dirigé selon OP. 


Prenons un axe Ox porté par AB. Un petit élément de 
fil de longueur ôx et situé au point M d’abscisse x pro- 


: _ ôg. | 
duit en P le champ €; = Le Ta, où Ôôg est la charge 
REO T 
de l’élément, r la distance MP et uü le vecteur unitaire 


dans la direction MP (le nombre € est la constante di- 4 
électrique du milieu ambiant). En supposant que le fil 
a une densité de charge À constante, on a 0g = Aôx. Le champ produit par deux 


éléments de fil symétriques par rapport au milieu © est dirigé selon OP et son 


intensité est —— re cos 0), où Ô est l'écart angulaire des vecteurs MP, OP. 
NEO T 
a 


Notons a la distance OP. On a cos = ©, r?=4a?+x? et coie = ©, donc le champ 
T id 


-@. 
+ . + F 
électrique en P a pour intensité 


2/2 
E = A | dœ , où L est la longueur du fil. 
o (a? 
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La fonction sous le signe intégrale ayant pour primitive ———, on obtient E — 


a Va? + x? 
—_ A] Faisons tendre la longueur £ vers l'infini. Puisque V4a? +02 + 4, 
2re0avV Aa? + 2 £—+00 
il vient EE + En champ électrique créé à la distance a par un fil de très 
l—+oo 2TEoa 
: 2 +00 d À 

rande longueur (£ > a) a donc pour intensité -\2 Î L = : 
8 84 Œ>a) P TEo 0 (a? Hair 27Eoa 


Exemples fondamentaux. Soit a > 0. 


T 
1) Pour la fonction x + Le l'intégrale | a —Inx-Ina tend vers + quand x 
T a 
tend vers +c : l'intégrale généralisée de 1/x sur [a, +oo[ n'existe pas. 


2) Pour la fonction x + . où a £l,ona 
T 


[ #-/fra- æ17® ae 
ot L 1—-a 1—-a 


- Sia>l, alors 1—a<0 et xl-® tend vers 0 quand x tend vers +co. L'intégrale 
00 +00 1-a 
dt existe et l’on a | dt _ _a = 1 : 
4° de 1—@ (æœ—1)a 
- Si a <1, alors x! ® tend vers + quand x tend vers + et l'intégrale 


généralisée n'existe pas. 


+ 
généralisée | 
a 


+00 
Si a > 0, l'intégrale généralisée | . existe si et seulement si «à > 1. 
a 


Voici l'outil principal pour étudier l'existence d’une intégrale généralisée lorsqu'on 
ne peut pas calculer explicitement une primitive. 


Théorème de comparaison. Soient f et g des fonctions continues sur [a, +ol. 
Supposons que l'on a O0 < g(x) < f(x) pour tout x. 


— Si l'intégrale généralisée de f existe, alors celle de g aussi et [7 3®) dt < ui f(6) dt. 


(ei 
— Si l'intégrale généralisée de g n'existe pas, celle de f non plus. 


Démonstration. Posons F(x) — [ FE) dt et G{x) = Le g(t) dt. Puisque f(x) et g(x) sont 
positifs ou nuls pour tout x, les fonctions F'et G sont croissantes. Supposons que l'intégrale 
généralisée de f existe. Quand x tend vers l'infini, F(x) a une limite finie, donc est majoré 
sur [a, +oo[. Puisque f < g, on a G(x) < F(x), donc G{x) est aussi majoré sur [a, co. La 
fonction G étant croissante, on en déduit que G{x) a une limite finie quand x tend vers +oo 
(voir les propriétés des fonctions monotones, page 264). = 


Conséquences. Soient f et g des fonctions à valeurs positives et continues sur [a, +oo. 
Supposons que l’on a g(x) << f(x) ou bien g(x) + f(x). Si l'intégrale généralisée 
T—+00 T—#00 


de f existe, alors celle de g aussi. 
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Démonstration. Si g(x) est infiniment petit devant f(x) quand x tend vers +00, alors pour 


x assez grand, on a g(x) < f(x). Si g(x) ds f(x), c'est-à-dire lim ee = 1, alors pour 
æ—++00 æT—+oo T 


æ assez grand, on a g(x) < 2f(x) (par exemple). Dans les deux cas, on a donc g(x) <2f(x) 
oo +00 
pour tout x > À > a. Si l'intégrale F. f(t) dt existe, il en va de même de a 2f(t) dt 


+oo 


+oo 
D'après le théorème de comparaison, Î g(t) dt existe, donc aussi li g(t) dt. ü 
A 


a 


Pour voir si l'intégrale généralisée d'une fonction positive f 
existe, on peut remplacer f(x) par un équivalent en +co. 


Exemples 
ee 1 
x? +1 200 2° 


2) Puisque x?e-% 


vt 


A dt existe. 


+00 
1)On a donc l'intégrale généralisée Î 


tend vers 0 quand x tend vers +, on a e < (1/x?) et 
T—+00 


+00 


ys 5 7: à? +00 2 ‘ . À 12 
comme l'intégrale généralisée / (1/t°) dt existe, il en va de même de À e " dt. 


2 +00 2 
+ _ —t 
RE À e !" dt. 


3) La fonction 1/(xInx) a pour primitive In(Inx) qui tend vers + quand x tend 
vers l'infini : 1/(xlnx) n’a donc pas d’intégrale généralisée sur [2,+00{[, bien que 


2 
T 


0 
La fonction e * étant paire, on a aussi F. 


—O0 


cette fonction soit infiniment petite devant 1/x. 
G t)? 


sin t)? 
dt existe si & > 1, car Ent < 


+00 
4) L'intégrale généralisée Î a ja 


Cas d'une fonction qui ne garde pas un signe constant. Nous allons voir 
que l'intégrale généralisée existe pourvu que la fonction ne soit pas trop grande en 
valeur absolue. 


Proposition. Si l'on a |f(x)| < g(x) pour tout x > a et si l'intégrale généralisée de q 
existe, alors celle de f aussi. 


nn Posons h(x =|f(x )| — f(x) de sorte que l’on a h(x) > 0. Puisque — f(x) < 


f(œ 


de ï d'après . Hd de comparaison. La fonction f(x | f(x )| — h(x) est différence 


<|2F( f(x - <2g(x). nn. de 2g(x) existe, donc aussi celle 


de deux fonctions ayant une intégrale généralisée, donc f a une intégrale ous = 


on ra = lim arctan 7 = 
T— +00 


sin x < 


Exemple. Pour tout x, on a | © 
z +1 


. Puisque |” L 
x? _ Lo 0 


+00 
5 on en déduit que l'intégrale généralisée Î er dt existe et que sa valeur est 
+1 
: LL . [0 sat 7% sint sin æ : : 
moindre que —. On a aussi Re dt= 4 = dt, car x ——— est impaire. 
2 ?+1 0 #+1 x +1 
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Fonction tendant vers l'infini en un point 


Exemples fondamentaux. Soit à un nombre positif. Quand x tend vers 0, 


1 
1/x% tend vers l'infini, mais étudions la limite des intégrales F(x) = Î On a 
T 


1x : 
rt = | ie si aZ£l 
— In x sia=l 


- Si a <1, alors x! ® tend vers 0 quand x tend vers 0 et F(x) a pour limite 
1/(1-a). On peut alors définir l'intégrale généralisée de la fonction 1/x° sur ]0,1] 

17 

1-a° 


Si à > 1, alors lim F(x) = +c et l'intégrale généralisée sur ]0,1] n'existe pas. 


ldt _;; _ 
en posant Î ne — lim F(x) = 


Définition 

Soit f une fonction continue sur l'intervalle semi-ouvert [a,b[. Si les intégrales 
L i f(t) dt ont une limite finie quand x tend vers b, on note cette limite fl ° f() dt 
et on l'appelle l'intégrale généralisée de f sur [a, b]. 


Le théorème de comparaison, ses conséquences et la proposition précédente sont en- 
core vraies dans ce cadre, en remplaçant « x tend vers l'infini » par « x tend vers b». 
De manière analogue, on définit la notion d’intégrale généralisée pour une fonction 
continue sur un intervalle semi-ouvert ]a, b], comme dans l'exemple précédent. 


Exemple 1. La période T d’un pendule simple de longueur { dépend de l’angle 
% dont on l’a écarté par rapport à la verticale (0 < 05 < x/2) : 


CA 
Tr-a.l£ | dO 
29 Jo /cos 0 — cos 4 
Dans la fonction sous le signe intégrale, le dénominateur s’annule si 0 — 6, donc la 
limite est +oo quand 0 tend vers 6 : l'intégrale est une intégrale généralisée. Pour 


vérifier son existence, cherchons un équivalent de V/cos 0 — cos 6 quand © tend vers 


60. Puisque cos’ 45 — — sin, on sait que cos 4 — cos 6b _ (8 — 85)(— sin 4), donc 
—U0 


1/cos 8 — cos re (V/sin 6) 60 — 0 
1/sin6o 


(80 U g)1/2 ù 
a une intégrale généralisée sur [0,6,|, car l’exposant 1/2 est strictement 


et la fonction sous le signe intégrale est équivalente à La fonction 


= 1h 
(80 — 0) 7? 
inférieur à 1. On en déduit que l'intégrale exprimant la période T est bien définie. 
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1 
Exemple 2. L'intégrale généralisée = 4 vaut 7 : en effet, d’après le tableau 
P 8 8 [ 1 AE P 
1 
des primitives page 298, F dt _ = Arcsinx, donc Î  _—JArcsinl=7r. 


Vi -1 V1-# 


Exemple 3. Posons f(x) —1/sinx. Quand x tend vers 0, f(x) est équivalent à 1/x 
et l'intégrale généralisée de 1/x n'existe pas sur ]0,7/2], donc celle de f(x) non plus. 


7. Application aux probabilités 
7.1 Fonction de répartition et densité 
Soit X une variable aléatoire prenant des valeurs réelles. 
Définition 
Pour tout nombre réel x, posons F(x)=P(X<x), probabilité pour que la valeur de 
X soit inférieure ou égale à x. La fonction F s'appelle la fonction de répartition de X. 


La probabilité pour que la valeur de X soit dans l'intervalle ]a, b] est 


Pa < X <b) = F(b) — F(a) 


Exemple. Supposons que X est la somme des points donnés par un lancer de 
deux dés. Le nombre de façons d'obtenir k points dépend de la valeur de k : si k 
est entre 2 et 7, il y a k —1 façons, sinon il y en a 13 — k. On en déduit la probabilité 
px d'obtenir k points : 


F(x) À 
k1213141516171819110!11|12 : 
1 33/36 
30/36 | 
9 26/36 
21/36 
Pk 
15/36 
1/6 
/ 10/36 
6/36 
3/36 
| [ . 1/36 . 
1234567 8 9101112 k 123456 7 8 9101112 T 
diagramme en batons fonction de répartition 


Cette fonction de répartition est en escalier. 


Propriétés d'une fonction de répartition 


a) La fonction de répartition est croissante : en effet, si x < y et si l'événement X < x 
est réalisé, alors l'événement X < y aussi. 
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b) Pour tout x, on a 0 < F(x) <1, car F(x) est une probabilité. 
c) lim F(x) =0 et lim F(x) = 1. 


T——00 


d) Si des nombres x, > x tendent vers x en décroissant, alors F(x,) tend vers F(x). 


Définition 
S'il existe une fonction f à valeurs positives telle que F(x) = d. f(t) dt pour 


tout x, on dit que f est une densité de la variable aléatoire X. 


+ 
On a J © f(E) dt = lim F(x) = 1. 
—00 T—>+400 
La densité d’une variable aléatoire détermine entièrement sa loi de probabilité. 
Si la densité est continue, alors F est dérivable et F'(x) = f(x). 
Choisissons en effet un nombre a quelconque. On a 
F(a)-F(a) =] f@at- [" foat- [ FO; 


cela montre que si f est continue, la fonction x + F(x) — F(a) a pour dérivée f(x), 
donc aussi la fonction F. 


Définitions 

Soit X une variable aléatoire de densité f. 
+ 

— L'espérance de X est E(X) — Î “+ f(t) dt, si cette intégrale généralisée existe. 
— 00 


2, c'est-à-dire le 


La variance de X est l'espérance de la variable X? — E(X) 
nombre V(X) — a . [t? — E(X)?]f(t) dt, si cette intégrale généralisée existe. 


L'écart-type est \/V(X). 


Propriétés 

il Si a et b sont des nombres, alors E(aX + b) = aE(X) + b. 

ü) Si des variables aléatoires X et Y ont une espérance, alors E(X +Y) = E(X) + E(Y). 
ï V(X) = EÏ(X - EX))]. 


Justification. Pour aZ£0, l'inégalité aX +b<x s'écrit X< (x—b)/a ; si F est la loi de répartition 
de X, alors la loi de aX +b est F((x—b)/a) et sa densité est g(x)=(1/a)f((x—b)/a).On a donc 


E(aX + b) = I) dt 


a 


= . (au + b)f(u) adu (changement de variable &{ = au + b) 
a — CO 
+oo +00 
=a uf(u du +d | fu) du = aE(X) +b. 
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Montrons maintenant (ïii). En posant E(X) — m, on a (X — m)? = X? — 2mX +m?, donc 
en prenant l'espérance, il vient E[(X — m)?] = E(X?) - 2mE(X) + m°? = E(X?) — m? = 
E(X? — m?) = V(X). ü 


7.2 Des exemples de lois de probabilité 


La loi uniforme 
Soient a et b des nombres tels que a < b et soit f la fonction définie par 


= {Te si a<x<b 
— — à 
0 sinon 


+ 
Une variable aléatoire X de densité f est dite uniforme. Son espérance est Î . f (6) dt= 
—00 


b t — 1 b? — a? _ _a+b 
Li dt= EL, donc E(X) = +. 


À f(x) 
1 
b—a 
= 
a b zx HA 
densité uniforme fonction de répartition 


La loi exponentielle 


Exemple. L'instant de désintégration d’un atome d’élément radioactif est un événe- 
ment aléatoire. Si un atome ne s’est pas désintégré à un instant donné f, la probabilité 
qu'il se désintègre au cours d’un intervalle de temps à partir de cet instant ne dépend 
que de la longueur de l'intervalle. Appelons F(t) la probabilité de désintégration 
avant l'instant t. 

Si X est la variable aléatoire «instant de désintégration », on a donc P(X <t)= F(t). 
La probabilité de désintégration au cours d’un petit intervalle de temps [f,t+ ôt] est 
proportionnelle à ôt et à la probabilité 1 — F(t) de non-désintégration avant l'instant 
t. On a ainsi 


F(t+ 6t) — F(t) = [1-— F(t)]Aôt, avec À constant. 


En faisant tendre ôt vers 0 et en posant y — Ft), il vient 


dy=(1—y)Adt , ET Àdt , et en intégrant : 


d 
| y — In(1—y)=At-c, où c est une constante. 
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Prenons comme instant initial £ — 0, de sorte que pour t = 0, on a y = F(0) = 0. 


\L et 


Alors c=0, 1—y=e 
F(t)=1-e ", pour tout t{ > 0. 


C'est la loi de répartition de X pour t > 0. Si t < 0, on a bien entendu F(t) = 0. 
0 si t<0 


La densité de X est f(t) — En YEN és 


L'espérance de X est 


+00 +00 
PER Î 7 APE dt = [- de + Ÿt+ à) x] — . donc la variance est 


+00 
}  — _ 
0 À 


NS 
& 
Il 
S— 
+ 
8 
PS 
H 
D 
Le 
Ke = 
> 
Si 
X 
= 
HE 
| 
LIN 
| 
aus 


— + 


t t 


densité exponentielle fonction de répartition 


Définition 
On dit qu'une variable aléatoire suit une loi de probabilité exponentielle si sa densité 


0 it<0 
est de la forme f(t) = { A 


ME 07 où À est un nombre positif. 
dl 


En raison de son importance pratique, nous allons étudier plus en détail la loi de 
Laplace-Gauss, dite aussi loi normale. 


7.3 La loi normale 


Une approche de la loi normale 


Effectuons n épreuves d'un événement aléatoire qui suit une loi binomiale de 
probabilité p, avec 0 < p < 1. La probabilité que k événements se réalisent est 


Wx = (rat , où l'on a posé q = 1 — p. 


L'espérance du nombre de réalisations est £ = np et la variance est V — npq (pages 
67-68). 
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Nous allons chercher l’ordre de grandeur de Wx quand k et n deviennent grands 
d'une manière telle que k reste compris entre E + avV et E+ BVV , où à et B 
sont des nombres positifs fixés tels que a < B. 

Ces conditions signifient que la différence k—E reste comprise entre a VV et BVV. 


n n 


Nous utiliserons pour cela la formule de Stirling : nl + n"e"V2rn. 


n— +00 


Posons z2=k—-E—k-—mp, donc k=np+zetn—-k=—=nq—-2. Ona 
() n! : n” e_" V2Tn 

E kl(n — KT (np+2)"P 2 (ng=2)" 7 ent) (na2) V/2r(np+2) 2r(nq—2) 
Examinons ce produit : puisque (np + 2) + (ng — z) = n, la fraction du milieu vaut 1 
et pour la même raison, on a n° = n"Pt#n"177, donc 


np aq" — nP+enNi Tr ppt gaz Æ (np}"P+* (ng)"—* 


Par suite 


np+z ng—2z 


n (np) (nq) 
PT /nnpro nd Mt (ng-2— 


( PA \/ A (1 2)" (1 Li re) M 


Posons x = —?_, quantité qui par hypothèse reste bornée quand n tend vers l'infini. 
n 


Puisque 2/np et z/nq tendent vers 0, (np + 2)(ng — z) = n?pq (i + ä) (i — à) est 
= 
27rnpq 


np np 2 1 
Remarquons que — = ———— est de l’ordre de /n, donc = 
T ae Z x/Nnpq vT np +2 (np/z)+1 


de l’ordre de 1//n et tend vers 0; de même pour 


équivalent à n?pq, donc le premier facteur dans (+) est équivalent à 


est 


4 
nq—2° 


Écrivons un développement limité de (np +2)1n (1 — —. =) Puisque In(1 + u) = 


2 
u — n + o(u?) quand w tend vers 0, il vient 


2 
2 __ 2 
(np + 2) In Gi m5) z + Gn , 


2? Z 


es = À Lire = donc tend vers (. 


où a, est infiniment petit devant 


2 

De même, (ng — z)ln (i + —Z7 ) z 2 + b,, avec b, tendant vers 0. 
nq — Z 2(nq — z) 

En ajoutant et en posant €, = à, + b,, on obtient 


AMAR (1 : ie so (1 TE :) 2 DCE Li 
x? ï n , x? 1 
D (np+z)(ng-2) 2 [1+(2/np)][1- (z/n0)] 


quantité qui est de l’ordre de —x?/2. On en déduit que W, est équivalent à dl" 


\/27npq 
1 | (k— me. 
NU exp 
V2T/npq 2npq 


+ Cn 


c'est-à-dire 


We 
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Dans nos conditions de passage à la limite, la probabilité binomiale (#)p“q"-" est donc 
approchée par la valeur en x = k de la fonction 
(@-E) 


f(x) = ENT exp | , où E = np et V = npq. 


La probabilité pour que le nombre k de réalisations de l'événement soit compris entre 


k—np ; 
E+avV et E+BVV est W=ÿ.e. W4, où l’on a posé xx = , c'est-à-dire 
: rx <B P Vnpq 


approximativement 
1 >. -(e:)?/2 2 1 >, Û —(xr)?/2 
D ———— e = —— Tkr1 — Tk)e 
V2TVNPG arr <8 VIT ai <8 


CAT Tk+1 — Th = . Puisque 2x+1 — xx tend vers 0, la somme tend, par définition 


Vnpq 
8 
de l'intégrale, vers | et"/2 dt (page 286). 


La probabilité pour qu'au cours de n épreuves, le nombre de réalisations soit compris entre 


B 2 
np + a,/npq et np + B,/npq tend vers = Î ete dt, 
A/ T œ 


Application. Dans la pratique, on peut utiliser cette approximation pour évaluer 
une probabilité binomiale lorsque n est grand et que p n'est ni trop grand, ni trop 
petit. Dans ces conditions, la probabilité pour qu’au cours de n épreuves, le nombre 
de réalisations soit compris entre k1 et k2, est à peu près 

k; — np i— ko — np 


exp( (= 2)dt, où a — 
£l 1 Vnpi Vnpq 


La fonction de Gauss 


: 1 —x?/2 
La fonction (x) = ——e */ 
V2r 


est une densité de probabilité. 
27 


æ +oo 
En effet, c'est une fonction positive, ses intégrales généralisées | (+) dt et Î o(t) dt 


existent (d’après l'exemple 2 page 326) et enfin, nous montrerons au prochain chapitre 


1 o(t) dt =1 


DO 


que l’on a 


e t/2 


] Définition 


La fonction de répartition D(x) dt s'appelle la fonction de Gauss. 


= le 

La fonction 4 étant paire, on a [° p(t) dt [Te dt=1- fe t) dt, c'est-à-dire 
D(x) + P(—x) = 1 

Puisque te-t/? est une fonction impaire, l'intégrale Fi A te-t/? dt vaut 0 : 


si une variable aléatoire a pour fonction de répartition ®, son espérance est nulle. 
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Les valeurs ®(x) ne s'expriment pas au moyen des fonctions usuelles, mais on peut 
en faire un calcul approché au moyen d’une table numérique (voir page 577). 


À y À 
04 1 
0,5 
123% 133% 
densité répartition ® 


Exemple. On jette un dé 1200 fois. Quelle est la probabilité pour obtenir entre 
180 et 210 fois le nombre 1? 
La probabilité est 210 


12 k 1200—k 
oo 
k=—180 6 6 
b . 180 — 200 
On peut l’approcher par 1 exp(—t?/2) dt, où a — œ —1,55 et 
P PE ST - [A Ce /1200 x (5/36) 
p= 2107200 LU 6774. On trouve ainsi P + ®(b) — (a) & 0,780 — 0,06 = 0,72. 


1/1200 x (5/36) 


La valeur exacte est proche de 0,738. 


La loi normale 
Généralisons la densité de Gauss pour rendre compte, en particulier, de variables 
aléatoires dont la moyenne n’est pas nulle. 


Définition 
Soient m et o« des nombres positifs. On dit qu’une variable aléatoire suit une loi 
normale de paramètres m et © (en abrégé .W(m,0o)), si sa densité est la fonction 


Je)= Le (A) = exp | 


( ovV2T 26° 


nn 1 z | 
La fonction de répartition de X est alors F(x) = ——— exp |—-——— | dt. 
P (x) a ' : »| 


20? 


On a F(x)=® (=) (changement 
de variable ou — 1 — m dans l'inté- 
grale). Les figures ci-contre montrent 
la densité f et la fonction de répar- 
tition F de la loi normale lorsque 
m=1l, pour o=1 et o=0,7 (comparer 
aux courbes page 67). 


À À — 
densité f . répartition F 


Oo 


> 
L 2.8 4 5 011234 7% 
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Dans une série de mesures, les erreurs sont souvent distribuées selon la loi normale : 
c'est pourquoi on l'appelle quelquefois «loi des erreurs ». 


Espérance et variance. Si une variable aléatoire X suit la loi normale .W(m,0), 
alors 
E(X)=m ét VX) =" 


Ces paramètres permettent de mesurer la probabilité pour que la valeur de X reste 
dans un intervalle donné autour de la moyenne. Pour tout nombre a >0, on a en effet 


P(IX-m| < ao) = F(m+ao) — F(m-ao) = (a) — b(—a) = 2®(a) —1 
Par exemple, P(|X—m|<o)=2®(1)-1=0,68 et P(|X-—m|<20) =2®(2)—1=0,95. 


Nous avons montré comment, pour n grand, la loi binomiale tend, au sens des pro- 
babilités, vers la loi normale de Gauss. Ce résultat est encore vrai dans un contexte 
beaucoup plus général et constitue une propriété remarquable de la loi normale. Pour 
l’énoncer, introduisons la notion de variables aléatoires indépendantes. 


Définition 

Soient X et Y des variables aléatoires à valeurs réelles. On dit que X et Y sont 
indépendantes si pour tous intervalles ]a.b] et ]c, d], les événements a<X<b et 
c<Y <d sont indépendants, c’est-à-dire si 


P[(a<X<b}et(c<Y<d)] = P(a<X<b) P(c<Y<d) 


Si l’ensemble des événements possibles est fini, les variables prennent un nombre fini 
de valeurs %1,%2,...,%, pour X, Yi,Y2,...,Yn pour Ÿ. Dans ce cas, X et Y sont 
indépendantes si et seulement si pour tout couple (i,j), la probabilité de l'événement 
(X = x; et Y = y;) est le produit P(X = x;)P(Y = y;) des probabilités. 


Théorème de la limite centrée. Soit (X,) une suite de variables aléatoires deux 

à deux indépendantes, de même loi, d'espérance m et de variance o?. Posons Xn = 

X3+Xo+...+X, 
nm 


D(b) — (a) quand n tend vers l'infini. 


. Alors pour tous nombres a <b, P LCLX,-mMm< OÙ | tend vers 
p 9 
Vn Vn 


Supposons que chaque X; représente le résultat d’une seule épreuve de probabilité p 
telle que 0<p<1:ona X;=1 en cas de succès, X; =0 en cas d'échec. L’espérance de 
X; est m—p et sa variance est a? = pq, où q—=1—9p. La valeur de X,+X2+...+X, est 
le nombre k de succès en n épreuves. L'encadrement oa//n < k/n—m <ob/,/n s'écrit 
np + a/npq < k < np +b\/npq (en multipliant par n) : l'étude menée en introduction 
montre donc le théorème dans ce cas particulier. 


Comme dans l'exemple précédent, ce théorème permet de calculer de manière 


approchée des probabilités de la moyenne X,, pour n grand. 
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Application au calcul d'un intervalle de confiance 


Au terme d’un processus de fabrication, on effectue un contrôle de qualité des pièces 
produites : sur un lot de 200 pièces, 24 sont défectueuses. 


Premier problème. On veut estimer la proportion p de pièces défectueuses avec un 
un indice de certitude de 0,95. 
Définissons la variable aléatoire X qui prend la valeur 1 avec la probabilité p (cas 
d'une mauvaise pièce) et la valeur 0 avec la probabilité 1—p (cas d’une bonne pièce). 
— L'espérance de X est m—1x P(X =1)+0 x P(X =0)=p 
et sa variance est 
g° = (0-m)"P(X = 0) + (1-m) P(X = 1) = p°(1-p)+(1-p)"p = p(i-p) 


Notre échantillon est représenté par une suite X1,...,X, (n — 200) de variables 


aléatoires de même loi que X. Faisons l'hypothèse que ces variables sont indé- 


Xiti + An : c'est 


pendantes (bonne qualité de l'échantillon) et posons X,, = 7 
la moyenne empirique des observations, donc X,, — 24/200 = 0,12. 
D'après le théorème de la limite centrée, la probabilité 

(1) P[|Xa-p| < 22] 


Vn 
vaut à peu près 0,95. En estimant l’écart-type o par 4/X,(1—X,) = 0,325, on 
obtient l’approximation PI |p—0,12| < 0,046 | = 0,95, ou encore 
P[0,07 < p < 0,16] = 0,95 

Une pièce donnée a donc une probabilité comprise entre 0,07 et 0,16 d’être dé- 
fectueuse, avec un indice de certitude de 95%. L’intervalle [0,07, 0,16] s'appelle 
un intervalle de confiance pour l'estimation de p au risque 0,05. 

Si l’on veut un intervalle de confiance au risque 0,01, il faut remplacer dans (1) 


le coefficient 2 par le nombre a tel que 2®{a) — 1 — 0,99, soit environ a = 2,58 
(voir la table page 577) ; on obtient un intervalle plus grand. 


Second problème. Combien suffit-il de contrôler de pièces pour avoir, avec un 
risque 0,05, un intervalle de confiance centré de longueur 0,04 ? 


24/p(1- 
On cherche n pour que, dans (1), l'amplitude — de la fourchette soit 
nm 


inférieure à 0,04. Comme on ne connaît pas bien p, majorons le produit p(1—p) 
par 1/4 (c’est le maximum de la fonction t{(1-t) pour 0 <t< 1). On trouve 
ainsi —L < 0.04, d’où n > (25)? = 625. 

vn 
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@ 1. 


@ 2. 


@ 3. 


ES Exercices mms 


On considère la parabole d’équation y = x? et le point A = (0,a), où a > 0. Écrire la 
distance AM quand M = (x,y) est un point de la parabole. Étudier les variations 
de cette distance en fonction de x. Quel est le minimum de la distance AM quand 
le point M parcourt la parabole ? (discuter selon la valeur de a). 


Un exemple d'attraction par un point fixe. Dans l’exercice 4 du chapitre précédent, nous 
avons vu que si a est un nombre strictement compris entre entre 0 et 1, la fonction 
f(x) = e7% à un point fixe s(a) > 0. 


a) Montrer que l’on a [f'(æ)| <a pour tout x > 0. En déduire que s(a) est un point 
fixe attractif de f. 


b) Pour tout entier n >0, définissons les nombres u,, en posant uy=1 et u,}1=e "#7. 


Montrer que l’on a lun —s(a)| < a"(1—s(a)). Calculer à 107* près la solution de 
l'équation 2x = e * (faire un changement d’inconnues). 


Une étude de point fixe. Soit a un nombre strictement positif. Pour tout x 2 0, posons 
f(x) = e®-1 et définissons les nombres u, par uo — 0 et un11 — f(un). 


a) Dessiner le graphe de f. Montrer que l’on a 0 < un < 1 et un+1 > un pour tout 
n (raisonner par récurrence). En déduire que les w, ont une limite inférieure ou 
égale à 1. Montrer que si a — 1, cette limite vaut 1. 


b) On suppose 0 < a < 1. Montrer que si 0 < x < 1, alors f(x) <a; en déduire 
lun —1] < a*luy—1| et limu, = 1. 


c) On suppose désormais a > 1. 
{i Montrer que la fonction f' est strictement croissante et tend vers +0co quand x 
tend vers +00. En déduire qu'il y a un unique nombre a > 0 tel que f’(a) = 1. 
Calculer f’(0) et f'(1) et montrer que l’on a 0 <a < 1. 
fi) Montrer que la fonction g(x) — f(x) — x est décroissante sur [0, a], croissante 
sur [a,+æ|, qu’elle vaut 0 en x — 1 et que son minimum en a est négatif. En 
déduire que l’équation f(x) = x a deux solutions : l’une, qu’on note r{a), entre 
0 et a, l’autre supérieure à a. On a donc 0 < r(a) < 1. Montrer que les nombres 
un sont tous entre 0 et r(a) et que limu, = r(a). 
üi) Montrer que la fonction (x) = xe-* atteint son maximum 1/e en x — 1. Mon- 
trer que le nombre b — ar(a) vérifie w(b) — g(a) et que b < a. En déduire que 
b < 1 et que r(a) est entre 0 et 1/a. 
iv) En admettant que la fonction {+ r(t) est dérivable et en utilisant la relation 
r(1-r) 
tr—1 
En déduire que la fonction r(t) est décroissante et qu’elle tend vers O0 quand t 


f(r(a))=r(a), montrer que r(t) est solution de l'équation différentielle r'= 


tend vers +oo. 
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[| Posons m — ep(a). Montrer que m<1, que f'(1/a) =m et que pour 
tout x € [0,1/a], on a 0 < f'(x) < m. En déduire que pour tout n, on a 
fun — r(a)| <m° [uo — r(a)| = r(a)m”. 

4. Estimation des paramètres d'une diffusion. Comme dans l’exemple page 305, supposons 
qu'après injection, la quantité de substance diffusée varie au cours du temps selon 
la formule q(t) = ae % + be, où le temps t est compté en heures à partir d’un 
certain instant origine. 


a) Voici des mesures de In g(t) : 


/ 2 3 4 5 6 
In g(t)[—0,571—0,95/—1,37|—1,75| 2,16 


Montrer qu’on peut prendre comme estimations a = 1,27 et a =0,4 (chercher une 
droite de régression, comme page 211). 


b} Posons r(t) = 1,27e 1 — q(t). Voici les mesures du logarithme de r(t) : 


t 2 3 4 5 6 
Inr(t)| —5,1 | —7,41-9,75] —12 |-14,5 


Montrer que l’on peut adopter la formule q(t) = 1,27e 04? —0,85e ?t, 


c) Comment varie q(t) pour 0 << 6? Quel est son maximum ? Dessiner le graphe 
de cette fonction. 


5. Sur un même dessin, représenter l'allure du graphe des fonctions suivantes au voi- 
sinage de x = 1; tenir compte de la position du graphe par rapport à la tangente 
et des positions relatives des graphes. 


V2-92+22-1 ; sinfn(x+1)}] ; (æ-l)inx ; e !/@-1Y 


(poser u = x—1 et écrire un développement limité à l’ordre 4 des trois premières 
fonctions ; montrer que la dernière est infiniment petite devant toutes les puissances 


de x—1) 
6. Calculons Z(x Va? ++ dt en intégrant par parties (a est un nombre non nul). 
a) Montrer que T(x) = x Va? + x? — ), avec J(x )= | 1 — dt 
Va + 7 + 


b) Montrer que J(x a? + €? dt — dt. En déduire la formule 
que J(x) =  v es _—… 
[Ve +6 at Love + + Emfe+ a? + x?|. 


@ 7. Enveloppe d'une famille de droites. Dans un plan muni d’un repère, on se donne des 
droites D; dépendant d’un paramètre réel {; l'équation de D, est de la forme 
(D:): p(t}x + q(t)y +r(t) = 0, où l’on suppose que les coefficients sont des fonctions 
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æ 


dérivables. L'enveloppe des droites D; est une courbe paramétrée Æ qui, pour tout t, 
est tangente à D, en un point M, = (xt), y(t)). 
a) Montrer qu’on a les égalités (1) : p(t)æ(t) + q(t)y(t) + r(t) = 0 et 
2) : p(t)x'(t) + q(t)y'(t) = 0, pour tout t. 
b) En dérivant (1), en déduire que x(t) et y(t) sont solutions du système linéaire 


aGut)+rG) =0 
P'(#)x(#) + d'(E)y(E) +7 (E) = 0 


Un exemple d'enveloppe. Étant donné un repère orthonormé 
(O:i,j) du plan, on considère le demi-cercle (C') de centre O 
et de rayon 1 situé du côté x >0. Imaginons un rayon lumi- 
neux parallèle à Ox venant frapper (C') en M—(cosô,sinô) : 
il se réfléchit dans une direction D; dépendant de 6. 


a) Montrer que si 0 < 0 < x/2, la tangente au cercle en M 
fait l'angle 1/2 — 0 avec Ox; en déduire que la droite 
D fait l'angle 20 avec Ox et que l'équation de Do est : 
x sin 20 — y cos 20 — sin 0 = 0. 


b) Montrer que lorsque 0 varie de —x/2 à 7/2, la droite D, enveloppe la courbe 
(E) : (x(8),y(0)), où (0) et y(0) sont solutions du système linéaire 
x sin 20 — y cos 20 — sin Ü = 0 
x cos 20 + ysin 20 — (1/2) cos 0 = 0 
En déduire que l’on a x(0)=(3/2)cos0—cos°0 et y(0)=sin®0 pour —r/2<0<7T/2. 
€) Montrer que la courbe (E) est symétrique par rapport à Ox. En , 
étudiant le sens de variation des fonctions (4) et y(), vérifier que 
(E) a l'allure ci-contre, où le point de rebroussement situé sur Ox 
est à l’abscisse 1/2. O 1 
C'est la courbe qu’on peut voir briller au fond d’un récipient cylin- (E) 


drique éclairé de côté. Les courbes ainsi obtenues par réflexion sur 
des surfaces s'appellent des caustiques. 


. Un cylindre évidé. Le cylindre C' d’axe Oz et de rayon 1 est formé des points à dis- 


tance unité de l’axe : l'équation de C' est donc x? + y? = 1. Évidons C . l'intérieur 
du cylindre C’. de rayon r et d’axe Oy : l'équation de C’. est x? +2? =r?. Appelons 
7 la courbe d’intersection de C' et de Cf. 


a) Les points de C' ont pour coordonnées (cost,sint,z) : montrer que 7 est formée 


des points (cost,sint, £Vr2-— cos? t). 

b) On suppose r > 1. Montrer que la courbe 7 possède une tangente en tout point 
(figure 1). 

€] On suppose 0 < r < 1. Montrer que 7 est formée de deux courbes fermées dis- 
jointes symétriques par rapport au plan x0Oz et que chacune de ces courbes a une 
tangente en tout point (figure 2). 
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d) Supposons que les deux cylindres ont le même rayon r =1. Montrer qu'aux points 
(+1,0,0), la courbe 7 se recoupe elle-même et trouver les vecteurs qui dirigent 
les tangentes en ces points? (figure 3). 


On voit qu'il n’est pas possible d’usiner précisément un «té» formé de deux tubes 
ayant même diamètre et même épaisseur. 


figure 1 figure 2 figure 3 


@10. Au cours d’un trajet de longueur L, un promeneur perd successivement ses deux 
canifs, cela ayant pu se produire de façon équiprobable en n'importe quel endroit 
du parcours. On cherche la probabilité p pour qu’en refaisant le trajet, le promeneur 
retrouve l’un des canifs avant d’avoir effectué une distance d. Notons X, et X2 la 
distance où se trouvent ces objets depuis le point de départ : X1 et X2 sont des 
variables aléatoires, de loi uniforme sur [0, Z]. 


a) Calculer la probabilité pour que X: > d et la probabilité pour que X3 et X2 soient 
tous deux supérieurs ou égaux à d. En déduire p = (d/L)[2-(d/L)|. 

b) Notons X la variable aléatoire : distance du point de départ au premier canif. 
Calculer la densité de X et montrer que l'espérance de X est L/3. 


11. Calcul d'un intervalle de confiance. En fin de fabrication, on veut savoir quelle est la 
durée de vie des composants électroniques produits. Un contrôle de qualité montre 
que sur 200 composants, 5 ont une durée de vie inférieure à deux ans. On sait que 
la durée de vie X d’un composant suit une loi exponentielle : P(X <t) =1-e-", 
où À est le nombre positif qu’on veut estimer. 

Considérons la variable aléatoire Y qui vaut 1 si X > 2 et O si X < 2. 


a) Montrer que l'espérance de Y est E = e?\, 
b) Représentons l'échantillon testé par la donnée Y:,...,Y,, où n — 200. Montrer que 
la moyenne empirique Ÿ , — he vaut 195/200 et que l’écart-type de Y 
2 va 20 


et Y, + 
200 V 200 


avec une probabilité supérieure à 0,95. En déduire que À est compris entre 0,001 
et 0,024 avec un risque d'erreur inférieur à 5%. 
En acceptant ce risque, à quelle proportion de composants le fabriquant peut-il 


s'estime à o = 0,156. Montrer que Æ est compris entre Ÿ ,— 


garantir une durée de vie supérieure à cinq ans ? 
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@ 12. 


13. 


c) Quelle durée de vie minimum peut-on raisonnablement garantir à 99% ? 


Des intégrales qui tendent vers 0. Soit f : [0,b] —R une fonction strictement croissante 


telle que 0< f(t)<1 pour tout t€[0,b]. On pose J,= Pt ” dt pour tout entier n>1. 


a) Montrer que l’on a {[f(t)] L- [f()]" pour tout n > 1. En déduire que la suite 
(Jh) est décroissante et qu’elle a une limite £ > 0. 

b) Soit £ un nombre tel que 0 < € < b. Posons a = b—Ee et r = f(a). 
( Montrer que l’on a 0<r<1et f(t) <r pour tout t € [0, a]. 
fi) Montrer que pour tout n > 1, on a 0 < J, < ar” +e (considérer l'intégrale de 
0 à a et l'intégrale de a à b). 
(ii) En passant à la limite quand n tend vers +co, en déduire 0 <LK<E. 

c) Montrer que lim, —0 (zéro est le seul nombre réel positif ou nul qui soit inférieur 
ou égal à tous les nombres € > 0). 


2 
intégrales de Wallis. Pour tout entier n > 0, posons 1, = .. (smt)" dt, où par 


convention lo = Î _e 1 dt — Fe 


2 
(sint)"sintdt, montrer que l’on a 1,11=n(ly 11h11) 


< 


a) En intégrant par parties [ 


et en déduire 1,11 = me 1 pour tout entier n > 1. Calculer Ji. 
nm 
b) En déduire les formules suivantes : 
1.8.5--.(2p-1) + 2.4.6 --.(2p) 
Lp — et Dp4 — : 
2.4.6---(2p) 2 1.3.5--:(2p+1) 
c) Montrer que pour t € [0,x/2], on a 0 < (sint)"*l < (sint)" pour tout n > 1. 
T,, T,, 
(i] En déduire que la suite (J,) est décroissante et que l’on a 12 ee > Es. 
I, 1, n+1l 
Th 
(iü) Montrer que lim #1 7. 
d) En appliquant l'exercice précédent, montrer que lim J, = 0. 


n— +00 
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Chapitre 11] 


Interpolation, calcul 
numérique d'intégrales 


1. Interpolation polynomiale 

1.1 Les polynômes de Lagrange 
Pour définir un polynôme P =po+pir +:..+phx" de degré n, il faut n+1 
coefficients : on peut donc s'attendre à ce que P soit déterminé par n+1 équations. 
Donnons-nous n+1 nombres %0,21,...,1, (deux à deux différents) et des valeurs 
Yo, Y1,...,Yn quelconques, et cherchons un polynôme P dont le graphe passe par les 
points (x;,y:). Les égalités P(x;) = y; s'écrivent sous forme d’un système de n+1 
équations à n+1 inconnues : 


P(x0) = Po + ToP1 + Tôpe ++ a Da = Yo 
P(x1) = po + tiP1 + tipo ++ xlpn = y 


P(tn) = Po + TnP1 + T2 po + ++ 2 Pn = Un 


Puisque les inconnues sont les p;, ce système d'équations est linéaire et l’on peut mon- 


trer que son déterminant est différent de 0. Par exemple, pour n—2, le déterminant est 


2 
1 Zo À 


1 T1 Tr? —= (to — æ1)(æ1 — x2)(æ2 — To) À 0 
1 x) à 


car nous avons supposé +0, T1, 22 deux à deux différents. 


Il y a une unique solution (po,p1,...,pn) et un unique polynôme P passant par les 
points (x;,y;). Nous allons montrer ce résultat et calculer le polynôme. 
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Cas du degré 1. Par les deux points A5 = (x0,%o) et A1 = (x1,Y1), il passe une 


x LA : . 
unique droite : sa pente est _, donc son équation est 
T1 — Lo 
… Yi — Yo TT] T — TG 
y = Yo + (x — 0) = Yo 
— T0 To — T1 T1 — XO 


Lo — Li L1 — Lo 
Cas n — 2. Cherchons le polynôme sous la forme 
P = ao(x — t1)(x — &2) + a1(x — to)(t — +2) + (x — ro)(x — ti) 


On a P(x0) = ao(xo — 1)(xo — 22), donc l'égalité P(x0) — y est réalisée si l’on 
Yo y1 


rend &p = . En posant de même a; — et &) = 
P u (to — 21)(To — 22) P £ (ti — Zo)(x1 — 22) É 
ee Va Pa on obtient la solution 
2 40 2 #1 
. (x — 21)(x — %2) , (x — xo)(t — 2) | (x — x0)(x — 1) 
(to — æ1)(xo — 2) (z1 — zo)(x1 — 2) (ta — to)(x2 — T1) 


En général, P est de degré 2, donc son graphe est une parabole. Mais si les points 
sont alignés, alors P est de degré 1 et son graphe est une droite. 


Cas général. On définit le polynôme de Lagrange Li qui prend la valeur 1 en xx 
et s'’annule en tous les x; tels que à # k : 


Le symbole [[,,, signifie que l’on fait le produit des n facteurs pour à tel que 0<i<n 
et i£ k. Chaque facteur étant de degré 1, le polynôme L;, est de degré n. Pour x = #4, 
le numérateur et le dénominateur sont identiques, donc L4(x#,)=1. Pour i£k etx=7#;, 
on a L4(x;) = 0 car (x-—x;) est un facteur au numérateur. 


Définissons le polynôme P en posant 
P = yoLo + li ++ ynln 


On a alors P(x0)=yoLo(to)+y1L1(t0) +: + -+YÿnLn(To)= Yo X 1+y1 X0+- + -+yn XO0=Y0, 
et de même P(xx) = yk pour tout k. Ce polynôme répond donc à la question. 


Définition 
| Le polynôme P s'appelle le polynôme d’interpolation pour les points (x:;, y:). 
Supposons que Q est un polynôme de degré inférieur ou égal à n tel que Q(x;)=y; pour 
tout i=0,1,...,n. Si P—Q n'est pas le polynôme nul, son degré est au plus n, donc P-Q 
possède au plus n racines (page 46). Or le polynôme P — Q s’annule en les n+1 valeurs 
To,-..,2n : C'est donc que P — Q est le polynôme nul, autrement dit P —Q. Cela montre 
que P est le seul polynôme de degré au plus n vérifiant P(x;) = y; quel que soit i. 
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À 
Exemple. Le polynôme d'interpolation pour les points 21 graphe de P(x) 


(to,go)=(1,0), (æ1,y1)=(2,0), (22,42) = (3,1), (æs,ys)= (4,1) 1 fi un 
est P= € (22° + 152-317 + 18). k, 1 
+: € + 


Interpolation d'une fonction 


Soit f une fonction. Si l’on connaît les valeurs y; = f(x;) en n+1 points 20,%1,...,Tn, 
le polynôme d’interpolation pour les données (x;,y;) prend les mêmes valeurs que 
f en Zo,L1,..., En. 

On dit que P est le polynôme d'interpolation de f en %o,%1,...,%n. 

Si pour les autres valeurs de x l'écart entre P(x) et f(x) n’est pas trop grand, on 
peut prendre P(x) comme valeur approchée de f(x), du moins quand x reste dans 
un segment contenant les x;. 


Le calcul d’une valeur P(x) ne demande que des multiplications et des additions : il 
est donc souvent plus rapide que celui de f(x), surtout 


À 


lorsque la fonction f a une expression compliquée ou 1 
faisant intervenir des exponentielles ou des fonctions tri- 
gonométriques. De plus, on peut optimiser le calcul de 6! 


P(x) en employant la méthode de Hürner (page 48). 


La figure ci-contre montre le graphe de la fonction 6% 041 | | ni 


et son polynôme d'interpolation (de degré 2) en z0=0,5, 1 2 3 
Ti = 1;.%5 = 2,5. 


Cas d'une fonction f connue par des valeurs discrètes. Il arrive que la fonction 
f ne soit connue que par les valeurs %,%1,...,Y qu’elle prend en certains points 
T0, T1,-..;€n. On ne dispose alors d'aucune formule générale permettant de calcu- 
ler d’autres valeurs de la fonction. Dans ce cas, P(x) peut constituer une formule 
approximative, mais raisonnable, pour la valeur f(x), à condition que x reste dans 
un intervalle convenable. 


Calcul du polynôme d'interpolation 


Voici une méthode pour calculer le polynôme d'interpolation relatif à des points 
(xo, yo), Cut d), ri (os dal 

Notation. Soient m1,Mm2,...,mx des entiers distincts compris entre 0 et n. On note 
Prism,….m, le polynôme d’interpolation aux k points d’abscisses Tin, , Tin, . .. ; Ty. 


Une formule commode. Soient x; et x; deux nombres distincts parmi {x0,...,%n}. 
Le polynôme d'interpolation en %6,%1,...,2x est alors 


(+) p=1Î Lea) Poe — (vi) Po...i-1,it1,.…k 
Ti ZT; 


Posons pour simplifier U—P6...,;5-1,5+1,..,8 et V=Po,..5-1i#1..,r. Puisque U et V sont 
des polynômes d’interpolation en k points, ils sont de degré au plus k—1, donc P est de 
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degré au plus k. Soit q un entier tel que 0<q<k, qÆi et g£j.Ona U(x,)=y,=V (x), donc 
1 1 
P(x;) — er [(ra—&;)U (x) — (ta—ti)V (ta) = 


Ti—T; 
On a aussi 


(£a Tj — La + Ti)Va = Ya 


et de même P(x;) = y;. 


Méthode. Supposons qu’on a calculé le polynôme Pi (interpolation en %0,x1) et 
le polynôme P2 (interpolation en x1,42). D’après la formule ci-dessus, le polynôme 


d'interpolation en %o,%1,%2 est Pp1,9 = —_— [(&—0)P,2 - (x) Po]. 
To —To 


Afin d'éviter des indices trop compliqués, posons @Q;0 = y; et 
Qi,a le polynôme d’interpolation aux d+1 points æi_q,i_dy1,...,%i, Sii>d2>l. 


Supposons qu'on ait calculé tous les polynômes Q;1 pour à > 1, c’est-à-dire tous 
les polynômes d'interpolation en deux points consécutifs x;_1,x;. Alors d’après la 
formule, le polynôme d'interpolation en trois points consécutifs x;_»,æ;_1,2; est 
1 
Qi2 = —— [(a—i-2)Qii = (x-)Qi11] 
Li Li-2 

(on a appliqué la formule (x) en choisissant les points extrêmes x;_2 et x; parmi 
les trois points ;_2,%;_1,t;.) 
Le polynôme @;; d’interpolation en quatre points consécutifs x;_3,%;_9,%;_1,%; s'ex- 
prime maintenant au moyen des polynômes d'interpolation en %;_»,%;_1,%; et en 
Li-3, Li-2, Ti-1, C'est-à-dire au moyen de Q;2 et Q;_12. De manière générale, si l’on 
connaît tous les polynômes Q; 4-1, alors 

. 1 

Qia = ———{[(x-ri-a)Qia-1 — (x-ri)Qi-141] 
Ti —Ti-_d 

Avec notre définition Q;0 = y:, cette égalité est encore vraie pour d = 1. On peut 
ainsi calculer de proche en proche Q,. qui est le polynôme d'interpolation aux 
points æo,%1,...,2%n, C'est-à-dire le polynôme cherché. 


Algorithme de Neuville 


initialisation : 
variable x 
nombres %0,21,...,1%n deux à deux différents 
nombres Yo,Y1;...,Un 


Qio + y pour 0<i<n 
boucle : pour à — 1,2,...n, faire 


pour d=1,2...,i: Qia+ + [(x—mi-a)Qia-1 — (t—-ti)Qi-1,a-1] 


Ti —Li-d 


fin : Qun est le polynôme d’interpolation pour les points (x;, y). 
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On pratique souvent l'algorithme en prenant pour + un nombre fixé : on obtient 
alors la valeur en x du polynôme d'interpolation. 

Cet algorithme présente un avantage précieux : au cours du calcul de Q,,, on 
a obtenu tous les polynômes Q,4 pour d£n; on peut donc ajouter un point 
supplémentaire et poursuivre l'algorithme en utilisant les polynômes déjà calculés. 
Supposons par exemple que pour une fonction f, on veuille calculer une valeur in- 
connue f(a) en interpolant à partir de valeurs connues f(x;)=y;. Si l’on s’est fixé une 
précision €, on peut ajouter des points tant que |Q, n(a) — Qn_1n-1(a)| dépasse €. 


Erreur d'interpolation 


Lorsqu'on interpole une fonction, il est bon de connaître une majoration de l'erreur 
|f(æ) — P(x)|, où P est le polynôme d’interpolation de f en %0,%1,...,7h. Supposons 
que f possède une dérivée (n+1)-ième continue sur un intervalle [a, b] contenant 


les x:;. 
Pour tout x € [a,b], on a f(x) — P(x) — FR ILotx—2x), où c est un nombre 
dépendant de x et compris entre a et b. 


Si l’on connaît un nombre M tel que |f(**)(#)| £ M pour tout #E [ab], alors l'erreur 
d'interpolation en tout point x de [ab] est au plus égale à 


oi | f(x) — P(x)| < M max IL - 
( i=0 


æela,b 


Ce résultat n’a qu’un intérêt théorique, car même dans le cas où f est définie par une 
formule, il est rare qu’on fasse une estimation de la dérivée (n+1)-ième. 


Démonstration. Si x est l’un des x;, les deux membres de l'égalité sont nuls. Supposons 
x différent de tous les x;, posons Q(t) = [[;_, (t — x) et 


pour tout t € [a,b]. 


On a g(x) =0, Q(x;) =0 et f(x;) = P(x;), donc la fonction g s’annule au moins en les n+2 
points æ#,%0,...,1n. D'après le théorème des accroissements finis, la dérivée g' s’annule dans 
chacun des n+1 intervalles délimités par ces points, donc g' s’annule au moins n+1 fois. En 


n+1) 


répétant ce raisonnement, on en conclut que la dérivée g{ s'annule en au moins un point c 


de [a,b]. La fonction polynôme t+- P(t) étant de degré n, sa dérivée (n+1)-ième est nulle, donc 


ge) = fe) - QE TE) 2 pee) (4 DÉC TE 
n a ainsi 0 = f(r+l(c n + "A fn à 2) et le résulta 
O 0 = FMH (c) — (n +1)! Qu) t1 Itat. O 
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1.2 Choix des points d'interpolation 


Lorsqu'on veut approximer une fonction f sur un segment [a,b], il est naturel de choi- 
sir les points d’interpolation %6,71,...,7, équirépartis dans le segment, c’est-à-dire de 
poser h—(b—a)/n et x0=a, 21=a+h,...,2%;=a+ih,..., 2, =0b. Mais pour un nombre 
de points donné, ce n’est pas ainsi qu’on obtient, en général, la meilleure précision. 


Les polynômes de Chebychev 


Pour tout x € [-1, 1}, posons cosô = x, où 0 <0< Tr. Si n est un entier positif, posons 
Tax) = cos(n0). Ainsi To(x) = 1 et Ti(x) = x. En utilisant la formule d’addition 
pour cos(a + b), on a cos((n + 1)0) + cos((n — 1)0) = 2cosOcos(n0) ou encore 


Tn1(x) = 22Tn(x) — Tn-1(x) 


Cette relation permet de calculer T; (x) de proche en proche à partir de Ti(x) et de 
Ti(x). Par exemple, 


D(x) = 22T1(x) — To(x) = 22? —1 et Tax) = 22 To(x) — Ti(x) = 42° — 3x 


La formule montre aussi que 7, est un polynôme de degré n et que son coefficient 
dominant est 2”! (raisonnement par récurrence). 


Les polynômes T}, s'appellent les polynômes de Chebychev. 


Les racines de T7}, sont les nombres x = cosÜ tels que cos(nf) = 0, c’est-à-dire 


2k—1 _ 
nÛ = in où k —1,2,...,n. Il y a donc ñn racines réelles rx; — cos (x), 
n 
1 T3 1} À5 
1% 17 
Cherchons les extrema de T,, sur le segment [—1,1]. On a 
dT, dT, dx _ dT, d(cosé)  dT, ; 
nm n n _ n 0 
dd dx dô dr  & a (sin) 
Pour x € ]-1,1{, sin0 n’est pas nul, donc 
dTn | . din _ d(cosnd) : : 
de = O si et seulement si db db —nsin(n0) = 0, 
ce qui donne 0 = Le, où k=1,2,...,n—1. Aux points 2, = cos(kr/n), l'extremum 


vaut Th (zx) = cos(n(kr/n)) = cos(kr) = (—-1)*. Puisque T,(1) = 1 (pour 0 = 0) et 
T,(—1) = (-1)" (pour 0 = 7), on en déduit la propriété suivante. 


Sur [-—1,1], T,(x) atteint ses extrema aux points 2, — cos(kr/n), où k—0,1,...,n, et 
Tn(2x) — (—1}$. 
Voici une propriété des polynômes de Chebychev. Posons T, — = Tn- Le coefficient 


dominant du polynôme T;, est égal à 1 : c'est un polynôme unitaire et de degré n. 
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Propriété. Pour tout polynôme P unitaire et de degré n > 1, on a 


mx ((a)l < max |Pa(x)| 


De plus, on n'a l'égalité que si P — Z. 
Démonstration. Supposons que P est un polynôme unitaire de degré n et que 


max |P,(œ)| < 1 2 ax Fe) : 


ze[-1,1] on—1 æE[-1,1] 


Le polynôme Q=T, — P est de degré au plus n—1, car le terme x" disparaît dans la différence. 


1? 


on—1 


On a Q(z%) = Ta(zx) P(2%x) = 


Q(z2x) <0 si k est impair et Q(z4) >0 si k est pair. Par le théorème des valeurs intermédiaires, 


P(2%). Par hypothèse, on a |P(x)| < — donc 


on en déduit que Q s’annule au moins une fois entre 24 et 241, pour k=0,1,...,n—1, 
donc possède au moins n racines dans [—1,1]. Comme un polynôme de degré n—1 a au plus 


n—1 racines, cela n’est possible que si Q — 0, autrement dit P =T,. î 


Application à l'erreur d'interpolation 


- Supposons que f est une fonction définie sur [—1,1]. Quand on interpole f aux 
points %o,%1,...,2%n de [-1,1], l'erreur provenant du choix des points x; réside 
)|, où I(x) = [[29 (x — x) est un polynôme uni- 


dans le facteur max,e|_11] [I(x 
taire de degré n+1. D'après la propriété précédente, ce terme sera minimum si 
= Ty =(x—r)(t—ro)...(x — ra), c'est-à-dire si l’on choisit 

2k+1 
2(n+1 


Eh = re = 008 ( r): pour k=0,1,...,n. 


Thul sur [-1,1] est De on en déduit que 


n 


Puisque le maximum de |T,11| = | 
si P est le polynôme d'interpolation utilisant ces n+1 points, on a la majoration 
1 x | Far (x)| 


max |f(x) — PE np 2x 1,1] 


xæe|-1,1] 

- Pour une fonction définie sur un segment [a,b] quelconque, on transporte ces 

abscisses par l'application affine u : [—-1,1] — [a,b] qui envoie —1 sur a et 1 sur 
b; elle est définie par u(x) = ; [(b — a)x + a + b]. 


Règle : Pour une meilleure interpolation, choisir les n+1 points d'abscisses x, = u(xx). 


l 
1+ 4%? 
— La figure ci-contre montre le graphe de f et celui du 


entre —2 et 2. 


Exemple. Soit la fonction f(x) — 


polynôme d’interpolation en les onze points x; = (0,4), 
où —5 < à < 5. Aux bords du segment, l’approximation 
est très mauvaise. 
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 Interpolons maintenant la fonction en choisissant les abs- 


cisses de Chebychev sur [—-2,2] : elles sont définies par 


x}, = 2 cos tx, où 1 <k < 11. On voit que, pour le 


même nombre de points, l’approximation est sensible- 
ment meilleure vers les bords du segment. 


1.3 Interpolation par des fonctions splines 


Quand on interpole une fonction f en utilisant un polynôme P de grand degré n, 
le graphe de P présente souvent des oscillations qui ne reflètent pas du tout l'allure 
de la fonction. Pour remédier à cet inconvénient, nous allons interpoler avec des 
polynômes de degré 3 en tenant compte de la dérivée de f. 


Interpolation avec trois points 
Donnons-nous trois points zo < æ1 < æ2 dans l'intervalle de définition de f. Nous 
allons construire une fonction S par morceaux sur chacun des intervalles [x0, x], 
[1,2] ayant les propriétés suivantes : 
A) sur (to, til], S = S est une fonction polynôme de degré au plus 3; de même sur 
[x1,æ], S = Si est polynomiale de degré au plus 3. 
8) pour i—0,1,2, S(x;)= f(x;), donc en particulier Si(x1)=f(x1) = S1(21) (conditions 
d'interpolation) 
C) Si(xi) = S'(x1) (raccordement des tangentes) 
D) Sÿ(x1) = SŸ(x1) (raccordement des courbures) 
E) l’une des conditions suivantes est vérifiée : 
il S"(xo) = S"(x2) — 0 (courbure nulle aux extrémités) 
ü) S'(xo) = f'(xo) et S'(x2) = f'(x2) (tangente imposée aux extrémités). 
Une telle fonction S s'appelle une fonction spline cu- 
bique pour ces données. Si l’on impose la condition 
(E) (il, on dit que la fonction spline est naturelle; si 
l'on impose la condition (E) {ii}, on dit que la fonction 
spline est contrainte. 
Une fonction spline prend 
« l'allure naturelle » des points 
Cherchons les fonctions Si et S1 sous la forme 
So(x) = ao + bo(x — to) + co(x — to)? + do(r — ro) pour x € [xo, 1] 
Six) = a + br — x) +a(r-m) +d(r-2) pour x € [x,x2] 
Les conditions précédentes s'expriment par des équations linéaires aux huit incon- 


S 
So 


Si 


Sotri) = Six) 
Si(x1) = Si(xi) 
Si(xi1) = SY(xi) 


> 
To ZT] T2 HA 


Une fonction spline contrainte 


nues @:;,b;,G,d;, à = 1 ou 2. Il y a aussi huit équations : quatre pour l’interpolation, 
une pour le raccord des dérivées premières en x, une pour le raccord des dérivées 
secondes et deux pour la condition aux extrémités. 
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Les nombres a et a; sont déterminés par ao = So(xo) = f(to) et a1 = S1(x1) = f(x1). 
Posons ho = %1 — To, h1 = %2 — 21, Q2 = f(x2) et c2 = (1/2)SY (x). 

Puisque SÛ(x) = 2co + 6do(x — +0) et SŸ(x) = 2c1 + 6d1(x — x1), il vient SP (to) = 2co, 
SU (x1)=2co+6doho, SY(x1)=2c1, SY(x2) = 201 +6d1h1. La condition (D) et la définition 
de c2 donnent alors les deux équations : 


(1) © = Co + 3doho ; (2) © = +3dih 
Les conditions d’interpolation a; = f(x1) = So(xi1) et as = f(x2) = Si(x2) s’écrivent 
(3) 1 — 4 — boho + Coh3 + dohà , (4) @2 — Qi — bihi + ch? + dihÿ 


Puisque S{(x1) = b1 et Si(x1) = bo + 2coho + 3doh, la condition (C) s'exprime par 
(5) _ bi — bo = 2Coho + 3dohÿ 
Tirons do et di de (1) et (2) et reportons dans (3), (4) et (5) : 


h2 h2 
(3) 1 — A0 — boho + 3 (2c0 + C1) ; (4) &2 — y — bihi + 3 ec + C2) 


(5’) bi = bo = ho(Co + C1) 
En tirant b, et b, de (3') et (4) et en portant dans (5’), on obtient 


d2 — dj di — 0 hi Dh Lente) 
hi Ro 3 


bi — bo — 3 


c'est-à-dire 


(+) hoCo + 2(ho + h1)c1 + hic 


à (ae a 


Si l’on choisit la condition [E} (il, alors 2co = SV (x0o) = 0, 2c2 = SY(x2) = 0 et les 
coefficients Co,C1,c2 sont solutions du système linéaire 


1 0 0 Co 0 
D 2(ho+h1) | ll = (um) en) 
0 0 1 C2 0 
Le second membre est connu, car ao = f(xo), a1 = f(x1) et a = f(x2). On détermine 
ainsi C1, puis les coefficients do et di au moyen de (1) et (2), et enfin bo et b1 au 

moyen de (3/) et (4’). 
a — ao Ro 
ho 3 


Si l’on a choisi la condition (E) (ii), alors on a f’(x0) = bo — (2Co + &1) 


en utilisant (3'), c’est-à-dire 
2hoco + hoc —= pm &o) — 3f'(xo) 


De même, on a f'(x2)=S1 (t2)=d1 +2c1 h: +3d: RŸ=b: +2C1 hi +h: (co—c1)=b1 +h1 (cr + C2) 
en utilisant (2), et il vient 
hic + 2h10Co = 3f'(x2) = À (2 = &1) 
1 

En tenant compte de (+), les coefficients Co,c1,c2 sont solutions du système linéaire 

2ho ho 0 Co (3/hko)(a1—ao)-3f'(x1) 

ho 2(ho+h1) h1 C1 = (3/hk1)(a2—a1)—(3/ho)(a1—ao) 

0 hi 2h: C2 3f'(x2)—(3/h1)(a2—a) 
La matrice du système est à diagonale strictement dominante, donc est inversible (page 
250) : il y a une unique solution. Après avoir résolu ce système, on en déduit do,d1,b0,b1 
comme précédemment. 
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Exemple. La fonction spline naturelle passant par les points 
(0,0), (1,3) et (2,2) est définie par 


L Ax—x si 0<x<l 
S(x) = 3 2 : 
x'—62+10r7-2 si 1<x<2 


Cas général 
Supposons que la fonction f est définie sur [a,b] et donnons-nous des nombres 
a = Xp < Li °°: < Tn-1 < En = 0, avec n > 2 
Une fonction spline cubique interpolante pour ces données est une fonction S définie 
sur [a,b] ayant les propriétés suivantes : 
A]sur chaque intervalle [x;,x;:1], où i—0,1,...,n—1, S=—S; est une fonction 
polynôme de degré au plus 3 
B) S(x;) — f(x;) pour i—0,1,...,n (donc en particulier S;(x;41) = S;:1(x:41)) 
C) Si(ri1) = Sisi(tir1) pour i=0,1,...,n—2 (raccordement des tangentes) 
D) SY(tir1) = Sfhi(tir1) pour à = 0,1,...,n — 2 (raccordement des courbures) 
E) l’une des conditions suivantes est vérifiée : 
i S'(a) = S”(b) —0 (tangente libre aux bords : spline naturelle) 
ü) S'(a) — f'(a) et S’(b) = f'(b) (tangente imposée aux bords : spline contrainte). 


On cherche les fonctions S5,81,-::,$,_1 sous la forme graphe de S(x) 

Six) = a + bi(x — ri) + ca — x)? + di(x — x, : s, 
où te [ru] et 0<i<n—1. S ; 52 
— Les coefficients a; sont donnés par a;=$S;(x;)=f(x:), 

pour DO<i<n—l1. | voa To A d 
On pose an — f(xn) = f(b) et h; = xi:1 — x; pour 

i=0,1,...,n—1. à 
— Pour calculer Co,c1,-::,Cn_1, On résout un système linéaire Ac=u, où c = “ 

e avec l'option [(E) (i), Cn 


1 0 0 ss sn 0 
ho 2(ho+h1) ha 0 
À = 0 hi 2(h1+h2) ho 


ln 2 2An 2+hn 1) Ra 1 
0 0 1 
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0 
(3/h1)(a2—a1)—(3/ho)(a1—@0) 


——t 


(3/hn-1)(an—an_1)-(3/An-2)(an-1—an2) 
0 


e avec l’option (E) (ii), 


2ho h5 0 . ne 0 


0 se .. hn 2 2(hn 2+hn 1) ln d 
0 ia 4 0 Rn-1 2hn-1 


(3/ho)(ai—ao)—3f"(a) 
(3/h1)(a>—a1)—(3/ho)(a1—ao) 


EU RCERSE es 
3f(b)—(3/hn_1) (An —Qn-1) 


Ces matrices À étant à diagonale strictement dominante, le système a une unique 
solution que l’on peut calculer par une méthode de relaxation (chapitre 8). 


Les coefficients b; et d; se calculent au moyen des a; et des c; par les formules 
analogues à (3/), (4’), (1) et (2) : 


b; — n (@iy1 — &) h (2c; + ci) pou 0O<i<n—l 
di = gp (in — ci) pour0O<i<n—l. 


Quand on cherche une fonction spline naturelle, on a seulement besoin de connaître 
les coordonnées des points d'interpolation : on peut donc faire le calcul lorsque la 
fonction n’est connue que par les valeurs qu’elle prend en un nombre fini de points 
To, --.;€n. On obtient alors une formule analytique acceptable et valable partout dans 
(to, zh]. Cela s'applique notamment lorsque la courbe est donnée par son seul dessin : 
en quadrillant le plan et en choisissant quelques points caractéristiques, on en déduit 
une bonne approximation analytique. 

> Il faut peu de données pour décrire une fonction spline : seulement quatre coefficients 
numériques pour chacun des polynômes de degré 3 qui la constituent. Le codage de 
la fonction est donc particulièrement économique. Dans une imprimante, chaque lettre 
est ainsi mise en mémoire sous la forme des coefficients des fonctions splines qui en 
décrivent le contour. 
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Exemple. Prenons la fonction f(x) — sin(x?) sur le segment [0,3]. 


— Avec les sept points d'abscisse ti —  ; 
(0,5)i, pour i—0,1,...,6, on obtient, ! 
par une courbe spline naturelle, l’ap- 


proximation montrée figure 1. 


En prenant les onze points d’abscisse 
zi = (0,3)i, pour à —=0,1,...,10, on 


obtient la figure 2. 


Approximation par une courbe paramétrée 

Quand la courbe n’est pas le graphe d’une fonction y(x), on ne peut pas l’approcher 

par une fonction spline. Dans ce cas, on cherche comme approximation une courbe 

paramétrée (x(t),y(t)), où x(t) et y(t) sont des polynômes de degré 3. 

Donnons-nous : 

deux points À et B, de coordonnées (x0,%0) et (x1,y1) 

et des vecteurs T5 = (uv, vo) et T1 = (u1,v1) : ce seront les vecteurs tangents à la 
courbe en À et B. 

Pour 0 <t< 1, posons 

a(t)= [2(xo—21)+(uo+u)] 4 [3(x1—%0) — (u1+2u0)] host YA 

y(t)= [2(vo—g1) + (vo+v1)]# + [8 (41 —v0) — (v1+2v0) | +vot+ vo QUE 

Cette courbe paramétrée a pour origine le point À (en t = 0), n B 


pour extrémité le point B (en t = 1), son vecteur tangent en À — (0 % 
est T5 et son vecteur tangent en B est 71. 


Calcul numérique d'intégrales 


Dans la plupart des intégrales qu’on rencontre, il n’est pas possible d'exprimer une 
primitive à l’aide des fonctions usuelles : on a alors recours au calcul numérique. 


Pour estimer la valeur d’une intégrale ['# f(€) dt, on approche la fonction " par une 


fonction @ dont l'intégrale est très simple à calculer. Puisque | [si f (6) dt — Pet t)dt\< 


(«2 


[ |f(t) (t)| dt, il faut que l'intégrale A |f(t)—-w(t)| dt soit petite : la fonction 4 
peut . notablement de f, mais sur de petits intervalles. 
On peut choisir pour & une fonction en escalier, comme celles qui permettent, par pas- 
sage à la limite, de définir l'intégrale (page 286). On fait ainsi apparaître des rectangles 
dont la somme des surfaces est une valeur approchée de l'intégrale d'autant plus précise 
que leur base est plus petite. 
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Une formule d'intégration exacte 
Pour toute fonction polynôme P de degré au plus 3, on a 


['roa- 


On vérifie facilement la formule pour un polynôme constant et pour les polynômes 


x, x?, «°. Comme le second membre dépend linéairement de P, la formule est vraie 


encore pour une combinaison &o + @1% + &2x? + aa. 


2 [P(a )+4p (20) + P()]| 


Si l’on approche une fonction f par un tel polynôme, on aura une formule simple 
qui donne approximativement la valeur de l'intégrale de f. 


La méthode de Simpson 
Soit f une fonction définie sur [a,b] et soit m — Lo le milieu de [a,b]. Approchons 


la fonction f par son polynôme d’interpolation P en a, m, b. Comme ce polynôme 


est de degré au plus 2, son intégrale sur [a,b] est donnée par la formule exacte 
a+ b 


ci-dessus. Or P prend les mêmes valeurs que f en a, et b, donc on a la 


formule d'intégration approchée 


[ro : 


Erreur d'intégration. Si f possède une dérivée quatrième continue, alors en posant 
M — MAX %e a, b] | f(x) 


[ 100 dt — 2 Tr(a) + 47 (LS) + 10)| <td y 


2 Ga) +47 (2) + 7) 


)|,on a 


2880 
b 
Démonstration. Posons E = 1 [f(t)—P(+)] dt, de sorte que dans la formule ci-dessus, le 
premier membre est |E|. Posons m = a et considérons le polynôme 


SG) = Pa) + px LP'On)- M] QG), où Q(e) = (e — ax — me 0) 


En a,m,b, le polynôme S prend les mêmes valeurs que f. De plus, on a Q'(m)=(m—a)(m—b)= 
b—a a—b (b—a)? 


© Dunod -— La photocopie non autorisée est un délit. 


s 2 n , donc S’(m)= f'(m). Le polynôme Q est de degré 3 et s’annule en a,m.b, 


donc F Q(t) dt =0 d’après la formule exacte. Il s'ensuit que P et S ont la même 
intégrale sur [a,b], autrement dit E — PM )—5(t)] dt. Posons q(x) = (x — a)(x — m)?(x —b) 


et écrivons l'égalité précédente sous la . 


b - 
(1) B= fat) OT à 


Dans l'intégrale, le quotient n’est a priori pas défini en a, b et m. Mais la fonction f — S est 
F5) 
—à 
a ; en donnant cette limite comme valeur en a au quotient, on obtient une fonction continue 


dérivable et vaut 0 en a, donc tend vers la limite f’(a) — S'(a) quand t tend vers 
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FSC) 
t—a 
développement limité à l’ordre 2 de la fonction u = f — S s'écrit : 


en a. De même, la fonction se prolonge par continuité en b. Au point m, le 


7] 1 
u(t) = u(m) + u'(m)(t-m) - = cu (t-m)” +o[(t-m)°] = - de (t-m)” + o[(t-m)*] 
t 
car u(m) = u/(m) = 0. On voit que ik . tend vers (1/2)u/'(m) quand t{ tend vers m, 
—m 
u(t 
ce qui permet encore de prolonger par continuité la fonction a ; en M. Finalement, la 
f(t)-5() | | t—m) 


fonction est continue en tout point de [a. b]. 


q(t) 
Les valeurs q(t) étant négatives ou nulles, nous pouvons appliquer à l'intégrale (1) une 
proposition page 289 en choisissant w(t) = —q(t). On obtient 
c)—S è 
(2) E = a q(t) dt, où c est un nombre dans {a, b]. 
a\c a 
En raisonnant comme dans le calcul de l'erreur d’interpolation page 347, on montre que 


Ste) = 7) 


f(c) — FT q(c), pour un certain nombre d € [a,b]. 
! | D — aŸ5 
D'autre part, en intégrant le polynôme g(t), on a l q(t) dt = — _ 


, d'où le résultat. L 


et en reportant dans 
fO() @- a) 


(2), il vient E 
4! 120 


Pratique de la méthode 
Pour calculer précisément l'intégrale de f sur [ab], partageons le segment en 2n 
intervalles au moyen des points 
b—a 
2n 


Zo=a, t=ath,...,t;=a+ih, %, = a+2nh =b, où h = 


Le point x, est le milieu du segment [x6,x2] et plus généralement 24,1 est le milieu 
de [t2x, Top+o]. 


Sur l'intervalle [x0, x2], on a la formule d'intégration approchée de Simpson 


. 00 dt & 2h [ (wo) + 4f(œ3) + (2) 


Ge M, 
2880 
où M est le maximum de |f()(x)| sur [a,b]. Puisqu’il y a n intervalles, l'erreur 


et de même sur {x,x1], etc. Chaque fois, l'erreur est au plus égale à e — 


b 
totale sur | f(t) dt est donc au plus égale à 


2h 4 _ 
CUT (b— a) 2 htm = pm 


2880 2880 180 


Si l’on a pris suffisamment de points, l'erreur est en principe aussi petite qu’on veut, 


ne = 2nh 


sous réserve des arrondis qui s'accumulent quand on fait un grand nombre d’additions. 
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Algorithme pour la méthode de Simpson 
initialisation 
a, b des nombres 
p un entier positif pair 


he (b—a)/p 
I +— f(a) + f(b) 
(H+0) , (B+0) 

boucle : pour à = 1,...,p—1, faire 
æ=a+ih 


si à est pair alors L + Lo + f(x), 
sinon Li «+ Li + f(x) 
fn:1+ Rk(L + 21 + 41;)/3 


À la fin de cet algorithme, la variable 1 contient une valeur approchée de l'intégrale. 


Exemple. La longueur de l’ellipse d’équation x? + (y?/4) = 1 est 


m/2 
L=AI = a | V/(sint)? + 4(cost}? dt 
0 


L'intégrale ne s'exprimant pas au moyen des fonctions usuelles, calculons-la de ma- 
nière approchée en prenant n = 2. On a a —=0, b=— 7/2, h — x/8 et comme valeur 
approchée de 1, on obtient I = 2,4228. 


L 2 
L'erreur E est majorée par EC hiM = TE (x/8ÿM, où M est de l’ordre de 40, 


ce qui donne E < 8.10 %. En fait, la valeur exacte de J est proche de 2,4221, d'où 
une erreur vraie d'environ 7.10. Pour la longueur de l’ellipse, on trouve comme 
approximation L = 41 = 9,69, alors que la valeur exacte est plus proche de 9,6884. 


a Exercices emmmmmmx 


. @ 1. Un triangle de sécurité pour les courbes splines. 


© Dunod -— La photocopie non autorisée est un délit 


Soit À = (a,b) un point du plan non situé sur l’axe des abscisses. 
Considérons la courbe spline passant par l'origine O en t =0 
avec vecteur tangent OA et par le point U = (1,0) en t = 1 avec 
vecteur tangent _UÀ. Son équation est (voir page 354) 
{ x(t) = —t + (2-a)f + at 
gt) = —bt? + bt 


,où0O<t<l. 


a) Montrer qu’un point M —(x,y) du plan est du côté de U par rapport à la droite 
OA si et seulement si bx — ay a le signe de b. Montrer que M est du côté de O 
par rapport à la droite UA si et seulement si (a—1)y — bx + b est du signe de b. 
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b) Montrer que la courbe est dans le triangle O AU. 


Cette propriété est utile par exemple en robotique où l’on construit des fonctions 
splines pour faire évoluer les paramètres d’un mouvement : des triangles de sécurité 
disjoints permettent d'éviter les collisions. 


2. La figure ci-contre est la carte d’un étang : on mesure tous les 10 mètres les distances 
di,do,... ds : 


d do d3 du ds 


di do d3 da d5 


26m | 21,7m | 28,3m | 36,7m | 20,7m 


Montrer que ces données permettent d'estimer à 13,88 ares l'aire de l'étang. 


@ 3. Orthogonalité des polynômes de Chebychev. Les polynômes de Chebychev T,, sont dé- 
finis, pour n entier positif ou nul, par la formule T,(cos 0) — cos(n@) (page 348). 
Rappelons que T, est de degré n. 


a) On pose 1,  — [ T, (OT, (t)(1-8) "1/2 dt. En faisant le changement de variable 
t = cos 0, montrer que l’on a 160 =, Inp = 0 sinZ£p et Inn =7/2 sin>l1. 
b) Notons Æ l’espace vectoriel des fonctions continues sur [-1, 1]. Pour toutes 

fonctions f et g appartenant à E, on définit leur produit scalaire 


1 
fe Î ODA) TP de 


Posons Us = (1//7)To et Un = (1/2/7)Th pour n > 1. 

{ Vérifier que f :g est un produit scalaire sur Æ et que les polynômes U, forment 
une famille orthonormée (voir chapitre 7). 

li) Soit F}, le sous-espace vectoriel de Æ formé des polynômes de degré inférieur 
ou égal à n. Montrer que Uo,U:,...,U, est une base orthonormée de F;. 


c) Étant donné une fonction f continue sur [-1, 1}, posons Cn = f : Un : le polynôme 
P = coÙo + QU: + cU2 + Us est de degré inférieur ou égal à 3 et en notant 
lg = /g: 3 la norme dans l’espace euclidien E, on a | f — P| < ||f — Q|| pour 
tout autre polynôme Q de degré inférieur ou égal à 3 (page 209). 

On prend f(x) = x(sin2r)?. Montrer qu’on a à peu près P = 0,756x + 1,667. 
Représenter sur un même dessin le graphe de f et celui de P entre —1 et 1. 


@ 4.On veut interpoler la fonction f(x) = r(sin 2x)? de l'exercice précédent sur les abs- 
(2k—1)r 


cisses de Chebychev xx = cos , avec k — 1,2,3,4. Montrer que le polynôme 


d’interpolation est à peu près R—0,387x +0,629x*. Représenter sur un même dessin 
le graphe de f et celui de À entre —1 et 1. 
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Chapitre 12 


Fonctions 
de plusieurs variables 


1. Présentation 


Il est habituel qu’une quantité dépende de plusieurs variables. Par exemple : 


La solution X — [? 


“| de l'équation linéaire [o 4] X = Ë | est fonction des 
nombres ü, U,p,q. 


u q 

— La température en tout point d’une pièce d'habitation est, à un instant donné, 
fonction des trois coordonnées spatiales du point. 

- En Économie, à chaque panier constitué de n biens en quantités %1,%2,...,%», 
on associe son utilité U(æ1,%2,...,2,), un nombre qui traduit la préférence du 
consommateur pour cette composition d'achats. 


Représentation des fonctions de deux variables 


Soit u= f(x,y) une quantité numérique fonction des deux variables x et y. Il y a deux 
manières de visualiser la fonction f : par ses lignes de niveau ou par son graphe. 


Les lignes de niveau. Les points (x,y) où f(r,y) prend une valeur donnée k for- 
ment une courbe, appelée ligne de niveau de f (page 21). La ligne de niveau k a pour 
équation f(x,y)=k. Des lignes de niveaux k et k’ différents n’ont aucun point commun. 


Le graphe. Au dessus de chaque point m = (x,y) du do- 
maine de définition de f, plaçons dans l’espace le point M 
de coordonnées (x.y, Î (x,y)). L'ensemble de ces points M est 
par définition le graphe de f. Quand (x,y) décrit le domaine de 
définition D de f, le point M décrit une surface étalée sur D. 


Lx + 


L'équation du graphe de f est z = f(x, y). 
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Si l’on coupe la surface d’équation 2 = f(x,y) par le plan horizontal 
d’équation z = k, on obtient la courbe formée des points (x,y,k) tels 
que f(x,y) = k : la projection de cette courbe dans le plan des x,y 
est la ligne de niveau k. 


Les lignes de niveau sont les coupes horizontales du graphe. figure | 


On peut aussi reconstituer le graphe de f en plaçant chaque ligne de niveau à sa 
bonne hauteur : la ligne de niveau k dans le plan d’équation z = k (voir les figures 
du col, page 21). 

- Sur la figure 1, chaque ligne de niveau k > 0 est un cercle, ce qui est caractéristique 
d’une surface de révolution d’axe Oz. 

— La figure 2 montre la surface 
d’équation z—cos ee COS3TY. 
C'est, à un instant donné, la 
forme possible de la surface 
de l’eau dans une piscine rec- 
tangulaire où on laisse le li- 
quide osciller librement. Sur 
la figure 3, on voit des lignes figure 2 figure 3 
de niveau de cette surface. 


Normes et distances dans R’ 


On peut définir plusieurs notions de distance dans R?, par exemple au moyen d’un 

produit scalaire et de la norme associée (page 202). 

En utilisant la norme euclidienne ||(x,y)|| = 4/2? + y?, la distance de deux points 
P=(x,y), P'=(x,y) est d(P,P) =] PP'|= (ax) + (y). 
Notons © le point (0,0). Si r est un nombre positif, l’ensemble des points M tels 
que d(O, M) < r est le disque de centre © et de rayon r (bord non compris). 


On peut aussi considérer le maximum des valeurs absolues des coordonnées, en 
posant ||(x,y)|}, = max(}x|,|y|). Cette fonction a bien les propriétés d’une norme 
(page 204), mais contrairement à la norme euclidienne, elle n’est pas associée à 


un produit scalaire. Pour cette norme, on définit la distance des YA 
points P = (x,y) et P' = (x',y") en posant 
dm(P, 27) = || PP' In = max(|x'-x|,|ÿ -yl) 
—T Tr 
L'ensemble des points M tels que d(0, M) < r est le carré de À t 
centre © dont les côtés sont parallèles aux axes et de longueur 2r. Li 


Les nombres |x| et |y| sont inférieurs ou égaux à /x? + y?, donc |(x,y)|m <||(æ,y) ||. 
D'autre part, |x| et |y| sont inférieurs ou égaux à ||(x,y)|l, donc x? +? <2||(x,y)| 


et par suite |(x,y)|| < V2||(x,y)|lm. 


| 2 
m 
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Dans R”, on définit de même pour X — (%1,%2,...,%n), 


la norme et la distance euclidienne : 


Lx = Vai+ai+ tt, AY) = IX -NI 


la norme et distance « du sup » : 
IX = max(lail, tel... |tal) ; dm(AXY) = (XV) Im 


On a les inégalités | X | < [|X|] < /n|X|n. Il s'ensuit que pour des points X et 
Y quelconques de R”, 

si l’on a d(X,Y) < a, alors d,,(X,Y) < a 

si l’on a d,(X,Y) < b, alors d(X,Y) < b/n. 


Définitions 

Soit f une fonction de n variables définie sur un domaine D et soit À € D. 

On dit que f(X) tend vers £ quand X tend vers À si [f(X)—2] tend vers 0 
quand d(A, X) tend vers 0; cette propriété se note Jim FX) = £. 


La fonction f est continue en À si f(X) tend vers f(A) quand X tend vers À. 


Définition 

Soit D une partie de R” et soit À € D. On dit que À est un point intérieur à D 
s’il existe un nombre r > 0 tel que D contient tous les points M dont la distance 
à À est moindre que r. 


D'après les inégalités précédentes, on peut utiliser la distance qu’on veut pour vérifier 
si un point est intérieur. 


Propriété d'un point intérieur. Si A—(ai,a2,...,an) est un point intérieur à D, 
alors pour tous nombres réels t1,t2,...,t, assez petits, le point (ai+t1,a2+t2,...,an+tn) 
appartient à D. 
Posons en effet T = ({t1,t2,...,t,), de sorte que d,,(A, A +T) = |(A+4+T) — Al, = 
IT = max|t;|. Supposons À intérieur à D, donc il existe un nombre r > 0 tel que 
[dm(A, A+T) <r = A+T E D]. Si tous les |t;| sont inférieurs à r, alors leur maximum 
est inférieur à r, donc À + T' appartient à D. 


Intuitivement, un point À est intérieur à D quand D contient © G 


un voisinage de À. Les points du bord ne sont pas intérieurs. 
Par exemple, pour le domaine elliptique ci-contre, le point À est D) 
intérieur et le point B ne l’est pas. 

Pour une fonction f d’une variable réelle, on sait que si f est continue sur un segment, elle 


y atteint un maximum et un minimum. Ce résultat est encore vrai pour une fonction de 
plusieurs variables continue sur un domaine qui, comme les segments, contient son bord. 
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On dit qu’un domaine D de R” est compact s’il a les propriétés suivantes : 


i D est borné, autrement dit il existe un nombre R tel que l’on ait | X|| < R pour 
tout X € D. 

ü) D est défini par une ou plusieurs inégalités 4(x1,...,%,) < 0, où les fonctions 4 
sont continues sur R”. 


Si un point M est sur le bord de D, alors en M l’une au moins des inégalités de 
définition devient une égalité. Un domaine borné et contenant son bord est compact. 


Théorème. Soit D un domaine compact de R". Si f:D—R est une fonction continue, le 
maximum de f sur D et le minimum de f sur D existent et sont atteints en des points de D. 


Exemples 


Soit À un point dans l’espace R” et soit r > 0. Les points M dont la distance 
à À est au plus r forment un domaine D = {M ER" | d(A, M) <r} compact; 
si n — 2, D est un disque; si n 23, on dit que D est une boule. Le bord de D 
est la sphère formée des points M tels que d(A, M) = r : la sphère aussi est un 
domaine compact (elle est définie par les inégalités 0 < d(A, M) — r < 0). 

Dans R?, la couronne C = {M ER? |1< d(A,M) < 2} est compacte. Le 
bord de C’est la réunion des deux cercles de rayon 1 et 2 centrés en À. 


le domaine À — D \{A} dont le bord est formé du cercle unité et du 


 Enlevons son centre À au disque D={MER?|d(A,M)<1} : on obtient 
point À. Puisque À n’est pas dans À, le domaine A n’est pas compact. © 


Dérivées partielles 


Soit (x,y) + f(x, y) une fonction de deux variables définie sur un domaine D C R? 
et soit (a,b) un point intérieur à D. 

Pour tout nombre t assez petit en valeur absolue, le point (a +t,b) est par hypo- 
thèse dans D. La fonction d’une variable x + f(x,b) est donc définie sur un certain 
intervalle ouvert contenant a. Si cette fonction est dérivable en a, sa dérivée en a 


est lim f(a+t,b) = f(a,b) . 
t—0 A 


Définition 

Si la fonction x + f(x,b) est dérivable en a, sa dérivée se note SL (a, b) et s’ap- 
pelle la dérivée partielle de f par rapport à x au point (a,b). De même, la dérivée 
en b de la fonction y f(a,y) s'appelle la dérivée partielle de f par rapport à y au 


point (a,b) et se note on) 
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Par définition, 
de PORN) 


0x | 0 t y t—0 t 
Pour une fonction f de n variables (x1,12,...,2,), on définit de même la dérivée 
partielle al par rapport à la i-ème variable. 
Ti 


Pour calculer la dérivée partielle par rapport à x; en un point À = (a1,a2,...,a»), on 
fixe toutes les variables sauf x; en leur donnant leur valeur en A et l’on a 

Ô . Gas Qi Etes Qu lis 534 

À (4) = Tim F% t .) f(ai An) 


OT t—0 L 


3.1 Approximation affine, différentielle 


Comme pour une fonction d’une variable, cherchons à estimer la différence f(X)—f(A) 
quand X est voisin de À et qu'on néglige les quantités infiniment petites devant la 
distance d(A, X) = ||X — A||. 


Proposition. Soit f une fonction de deux variables ayant des dérivées partielles continues 
en un point À = (a,b). Alors pour tout X = (x,y) assez voisin de À, on 4 


FC) = F4) + (ea) DE (A) + (9) EE (A) + o(|X AI) 


Démonstration. Considérons un petit rectangle À, P,X,Q à côtés paral- 
lèles aux axes et contenu dans D et posons X =(a+h,b+k), P=(a+h,b) 
et Q = (a,b+k). D'après le théorème des accroissements finis pour les 
fonctions d’une variable, on a 


f(P) — f(A) = f(a+h,b) — f(a,b) = nf (u) , où U est sur le segment AP 
FX) — f(P) = f(a+h,b+k) — f(a+h,b) = OL (V) , où V est sur le segment PX 


En ajoutant ces deux égalités, on obtient : 


(1) FX) — FA) = h SU) + ke (V) 
Ox 0y 
Quand h et k tendent vers 0, les points U et V tendent vers À. Si les fonctions dérivées 
partielles of et Es sont continues en À, alors CAR, ) tend vers of (4) et av V) tend 
œ y 0x Ox 


vers 31 (4) ce qu'on peut écrire sous la forme 


de 0 dd 0 
EU) = SE (A)+ei(h,#) et SE (V) = ZE (4) +e2(h, 


où €1(h,k) et e2(h,k) tendent vers 0 quand À et k tendent vers 0. L'égalité (1) devient 


100 = 00 22% ar (Aya ne he. 
Ox 0y 
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Montrons que la quantité r(h,k) = he1 + ke2 est négligeable devant la norme de (h,k) quand 
hk et k tendent vers 0. Puisque |h| et |k| sont inférieurs ou égaux à |[(h,k)|,, on a [r(R, k)| < 


h,k 
lellhl+lellkl< [lil +lel]II(R,#) ln. Le rapport Ho est inférieur à |£1(h,k)|+|e2(h.k)] 
qui tend vers 0 quand h et k tendent vers 0 : on a ‘donc r(h,#) " . | IC, k)llrn- ü 
)—(0,0 
Si f est une fonction de n variables à dérivées partielles continues et si A—(a1,...,an), 
on a de même pour tout X = (h1,...,h,) assez voisin de A 
Ô Ô 
FOO= SCA) + (era) LÉ (4) + (2-02) PL (494 ++ (na) 2E (4) +o(IX A) 
Ôx: OX? OXn 
a ns Dr 
On dit que f(A)+(x1—a1) 3e, (A) + (x2—a>2) des (A) +: + (tn an) ET (A) est 


l'approximation affine de f au point À. 
Dans la suite, nous supposerons toujours que les fonctions 
considérées ont des dérivées partielles continues. 


Définitions 
Soit z — f(x1,2%2,...,2%,) une fonction de n variables. 
— La différentielle de f en A est la fonction linéaire 


dz = ci (À) dx + a (4) dta ++. + (4) dx de variables dx1,...,dxn. 


Or 
. sad, ul. | 

La matrice-ligne J;(A) 3e. (A) Des (À ) ET (A) | s'appelle la matrice 
jacobienne de f en À. 

dx; 

dx2 . . 

En posant dX = | . |,il vient dz = J;(A)dX : 
dt 


la matrice J$(A) est la matrice de la différentielle de f en A. 


Si l’on donne aux variables dx1,...,dx, des valeurs assez petites, alors dz=J;(A)dX 
est une approximation au premier ordre de la différence f(X) — f(A). 


Le vecteur gradient 


Il est intéressant d'introduire le vecteur-colonne (y r(4)), car J(A)dX est alors le 
produit scalaire de ce vecteur et de dX. 


] Définition 


— ,,, _[ôf of of 
Le gradient de f en À est le vecteur Grad;(A) ( (A), Tr (A),..., . (4)). 


La différentielle s'écrit ainsi dz = Grad (A): dX, où (: ) désigne le produit scalaire 
euclidien. 
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On sait que le produit scalaire est maximum quand les deux vecteurs sont colinéaires 


et de même sens, et que le produit scalaire est nul s'ils sont orthogonaux. 
Pour une petite variation vectorielle dX, de norme donnée, appliquée au point À, 
— dz est maximum et positif quand dX est dans la direction du gradient Grad/(A), 


— dz est négligeable devant || ax | quand aX est orthogonal à Grady(A). 


adX\ Grad/(A TT re. 
de (4) - IX TT Grad, (A) 


dz est négligeable dz est maximal 


Plan tangent à une surface 


Soit S la surface d’équation z = f(x,y), où f est définie sur un domaine D. Soit 
Ao = (X0,%) un point de D et soit Pj = (to; Yo, 20) le point de S correspondant, 


donc 20 — f(x0, Yo). 


Définition : . 
Si la matrice jacobienne J}(Ao) = | SE (Ae) SL (4o) n'est pas nulle, le plan 
d’équation 2 — 20 = J;(A5) ee s'appelle le plan tangent à S au point Fi. 


L'équation du plan tangent est donc 2 — 20 = (x — x) 2 (to, Yo) + (y — Yo) 7 (to, Yo) 


4 222 
a 


Considérons un point m=(x,y) voisin de A5. Sur une même 
verticale menée par m, se trouvent le point M = (x,y,2) appar- 


tenant à S et le point T = (x,y,t) appartenant au plan tangent 


à Sen P.Ona z2= f(x,y) et t = 20 + J;(Ao) Fe ul d’où 


MT = 3-1 . 
= F(e,2)-f (to vo) — (m2) GE (Go: vo) — (uv) GE (ro 40) 


Par la proposition précédente, cette quantité est négligeable devant Aom=||(2—%0,y—Y0) | 


quand m tend vers Ao. 


- Le plan tangent est horizontal (c'est-à-dire d’équation z = 20) si et seulement si 
@) Ô . - ; 
LL (0,80) — LL (ao, yo) = 0. Cela se produit notamment si la surface présente un 
TL y 


maximum ou un minimum en (x, Yo, 2). 
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3.2 Calcul des différentielles 
Différentielle d'une somme ou d'un produit 


Siu= f(x1,...,2n) et u=g(x1,...,2,) sont des fonctions de n variables définies sur 
un même domaine D, alors pour les matrices jacobiennes en un point À € D, on a 


J$+9(A) = Ji(A)+ (4) et J,(A) = f(4)J,(4) + g(A)J;(A) 
Différentielle d'une composée 


1) Supposons que z2=— f(x1,...,%,) et que 21,...,%, sont des fonctions æ1(t),...,xa(t) 
d’une variable réelle t. La différentielle de x; en to est dx; = x/(to)dt et en posant 
Mo = (æi(to),.…. ,Zn(to)), la différentielle de z en M est 

Ô Ô Ô 
OP (mojdr+ 2 (Mo)dmo+ ++ 2 (Mp)azs . 
0) Oxo? Ô 


T1 


Tn 


La différentielle en t de z= f{æi(t),...,xA(t)) est donc 


= CPC ACOPOE - + 2 (or (to) dt 
T1 0x2 On 
On en déduit : 
. " of æ' (to) 
(ko) = (Mo) (o)+ (Mo (to)+-+ (Mo)th (to) = Grad;(Mo)- 
T1] Ox2 Qu tn (to) 
n(£o 


2) Soit z = f(x,y) une fonction de deux variables. Supposons que chacune 
des quantités x et y est fonction de deux variables u,v : on a æ(u,v) et y(u, uv). 
En Uo = (wo, vo), x et y ont pour différentielles 


dx = OZ (Us)du + 22 (Uo)dv 


ou 
y y 
dy = —=(Uo)du + == (Uo)d 
y 2 0) re À o)du 
En Mo = (to, yo) = (x(uo, vo), y(uo, vo)), la différentielle de z est 
dz = À (Mo)dx + of (Mo)dy 
Ox 0y 


donc en Üo, la différentielle de z2 comme fonction de u,v est 


d=0E (M) [AE (Uu)du-+- LE (Uo) dur + (M) (PL (Oojdu+ PE (Os) 


: Ê (M) (U)+ 


Ô 
Ox Ou Ô 


@) @) 0) Ô 
Lu) 2406) | du | ECM) 2 u)+ PM) PEU) | de 
Y ou OT Ov 0y Ov 
On en déduit les formules pour les dérivées partielles de z par rapport à u et à v: 
0z _ Of or, 0f8y , oz 0f 0x, 0f 8y 
ou Ox Où  Oy Ou Ov Ox Ov dy Ov 
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Utilisation des matrices jacobiennes 
— Reprenons le calcul précédent en introduisant la fonction &:{u,v)- (x(u,v),y(u,v)) 
qui a deux variables et prend ses valeurs dans R?. 


+ La matrice jacobienne de f en M, est J;(Mo) = | SE) LG) | 


La fonction (u,v)- f(x(u,v),y(u,v)) est par définition la composée fo et sa 
matrice jacobienne en Us est Jr, (Uo) = | SE (D) 22 (Un) |, où z = fo p(u,v). 
En écrivant les formules ci-dessus sous la forme matricielle 


0x Ôx 
[ 22 Be] _|[0f 0f || ou ov 
Ou Ov OT 0y dy 0y 
Ou dv 
on obtient 
SE(Un) SE (Uo) 
Trop (Uo) — J(Mo) 0y 0y 
= (Uo) = (Uo) 
Ôx Ôx du ôv 
d (5) 2 (U) 
La matrice y y s'appelle la matrice jacobienne de & au point Un; 
Su (Uo) 5, (Uo 


on la note J,(U5) et notre relation s'écrit simplement 
Jsoe(Uo) = J$(Mo)J(Uo) , où Mo = p(Uo) 


Dans la matrice jacobienne de 4, la première ligne est la matrice jacobienne J, 
de la fonction (u,v) — x(u,v) et la deuxième ligne est J,,, matrice jacobienne de 


(u,v) + y(u, v). à a 


format de la matrice J, : à . 


— Prenons le cas d’une fonction f :(u,v) ++ (æ(u,v),y(u,v),z(u,v)) à deux variables 
et prenant ses valeurs dans R°. La matrice jacobienne de f est de même 


Jf— | J, |, où J+, par exemple, est la ligne Ée 


La matrice jacobienne de f a trois lignes et deux colonnes. 


Ces calculs se généralisent à un nombre quelconque de variables. 


Règle. Pour calculer les dérivées partielles d'une fonction composée f o g, on calcule sa 
matrice jacobienne J4(U) = J;(g(U))J(U). 
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Changement de coordonnées 


Coordonnées polaires. Donnons-nous un repère orthonormé (O:i,j) du plan. 
Tout point M = (x,y) différent de l’origine a des coordonnés polaires (page 39) 

= d(O,M)= Ya +% et 0=i0M, où 0<4<2r. 
On calcule x et y au moyen de r et 0 par les formules simples x=rcosé, y—=rsiné. 


Si une quantité w est fonction du point M, on peut l’exprimer comme une fonction 
des coordonnées cartésiennes ou comme une fonction des coordonnées polaires. On a 


dx = cos 0 dr — r sin 0 d = Ÿ dr — y dO 
Fe 

dy = sin 0 dr + r cos 0 dû = V Gr + x dO 
r 


donc pour une fonction w = f(x,y) = g(r,0), il vient 
| ow ow | Ow Ow | |cosO —-rsnm0| _ | 2w dw A —y 
ôr 00] | ôxr dy sinÿ rcosô | | x y ‘ 


En inversant la matrice carrée, on obtient 


[au ou] = [au ou] cosû  sin@ ]-[# “IL 7] 


0x dy or 60 1 |—(sin6)/r (cos0)/r ôr 


OM le 


Expression du gradient en coordonnées polaires. Soit ü — | 
OM 


vecteur unitaire dans la direction de OM et soit u le vecteur unitaire directement 
orthogonal à ü. On a 
ü = cos 0 à + sin 0j 
Uj = COS (047) ê+sin (o+7) j = sing i+ cos; 
et dans les coordonnées ee le gradient s'exprime par : 


Low > 


Grady — 1 
n ns Res 00 


Coordonnées sphériques. Soit M un point de l’espace. Projetons M en m’ sur 
le plan xOy et en m” sur l’axe Oz. Soit r — d(O, M) et si M n'est À z 
pas sur l’axe Oz, posons me 


0=i,Om (0£<0<92xr) et w—=Om,OM (-r/2 << r/2) 
Puisque Om’ = rcosw, le point m' a pour coordonnées polaires 
(r cos d,0) et l’on a Om’ = OM sin. Les nombres 


r=Vr+p+2, 6, 4 
s'appellent les coordonnées sphériques de M. 
Les coordonnées cartésiennes (x,7,z) de M sont données par les formules 


O 


æ=rcos/cosp , y—=rsmbpcoss et z=rsinvy 
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Pour une fonction w = f(x, y,z) = g(r, 0,4), il vient 


cos 0 cos —r sin 0 cos —r cos 0 sin 
simfcosp rcosôcosw —rsinäGsinv 
sin 0 Tr COS 


Ow Ow Ow Ow Où Ow 
Or 00 pp | | 0x y Oz 


Pour écrire la matrice de droite, on a disposé en ligne les matrices jacobiennes de 
x, de y et de z, chacune de ces coordonnées étant fonction des variables r, 0, . 


3.3 Applications aux variations d'une fonction 


Une fonction constante a toutes ses dérivées partielles identiquement nulles et la 
réciproque est vraie si le domaine D est, comme un intervalle, d’un seul morceau. 
Soit f une fonction définie sur un domaine D C R”. 


Caractérisation des fonctions constantes. Supposons que dans le domaine D, 
deux points quelconques peuvent toujours être joints par une courbe paramétrée dérivable. 
Alors f est constante si et seulement si toutes ses dérivées partielles sont nulles sur D. 


Démonstration. Supposons par exemple que la fonction a deux variables et soit A=(a,b) un 
point intérieur à ee f est constante, alors g(t)= f(t,b) est constante, donc g'(a)= … (A)=0 ; 
de même, on a a (A) = 0. Réciproquement, supposons que les dérivées partielles de 
f sont identiquement nulles. Pour tout point A = (a1,b1) appartenant à D, il existe 


par hypothèse une courbe paramétrée M(t) = (x(t),y(t)) telle que (x(to),y(to)) = A et 
(x(t1),y(t1)) = A1. Posons A(t) = f(x(t),y(t)), de sorte que A(t) = f(A) et A(t1) = f(A1). On 
of 

h'(t)= — 
ah()= 
quel que soit {, donc À est constante et en particulier f(A) = h(to) = h(t1) = f(A1). = 


(M(t))z'(€) + : (M(t))y'(t) Puisque les dérivées partielles sont nulles, h/(t) =0 
y 


Fonction constante par rapport à une variable 
Soit f une fonction de deux variables sur un domaine D. Faisons les hypothèses 
suivantes : 


a) la dérivée partielle SL est identiquement nulle, 
a 


b) si deux points de D sont situés sur une même parallèle à Ox, le segment qui les 
joint est dans le domaine. 


Alors les valeurs f(x,y) ne dépendent pas de x, autrement dit f(x,y) = g(y), où g 
est une fonction de la seule variable y. 

L'hypothèse (b) est vérifiée si par exemple D est le plan tout entier, ou une bande 
horizontale, ou un demi-plan de frontière parallèle à Ox. 


Soient en effet (a,b) et (a’,b) des point de D situés sur une même parallèle à Ox. Si t 
est entre a et a’, le point (t,b) est par hypothèse dans D. La fonction g(t) = f(t,b) est 
donc définie sur le segment d’extrémités a et a’ et puisque la première dérivée partielle 
_ Of 

Ôx 


de f est nulle, on a g'(t) = 5 (t,b) = 0. Il s'ensuit que g est constante entre a et a’, 
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autrement dit f(a,b) = g(a) = g(a’) = f(a’,b). Ainsi f prend la même valeur en tous les 
points situés sur la parallèle à Ox menée par (a,b) et cette valeur ne dépend que de b. 


Exemple : fonction sphérique. Soit w — f(x,y,z) une fonction du point M = 
(x,y,z) de l'espace. Cherchons à quelle condition w ne dépend que de la distance 


= dO, M). 
On doit avoir w = g(r). Puisque r? = x?+y?+2?, il vient r dr = x dx+ydy+zdz, d'où 


Ow __ dw Or _x y Ow _ dw Or __Y y Ow __ dw Or __Zz rs, 
8x drôr r? QE Oy dr dy r 9 ; 872  dr® r° (r) 
autrement dit Grada(x,y, 2) = 0 [æ y 2]. Ainsi le gradient de w en M doit être 


colinéaire à OM. 
= ; : | Ow Où Ow : 
KR te tout t M,1 dient — t li- 
ju Du Lens supposons qu en tou poin e gra ien (SE dx 5 y? 32 ) est Col: 


néaire à OM et que si deux points sont sur une même droite issue de l'origine, le 
segment qui les joint est dans le domaine de définition de f (sur une telle droite, 0 et 


Y sont constants). Rappelons que LE = —r sin 0 COS = —y, = r cos 0 cos = x et 
de 0. En posant 2 2 œ| = [x y z], on a alors 

Ow Ow, ., Ow Own _ _ _— 

50 5x | y) + TI 52° (Ax)(—y) + (Ay)x = 0. 
On vérifie de même que l’on a _ —0. Par conséquent, w ne dépend que de la variable r. 


Dans un bon domaine de définition, w ne dépend que de r si et seulement si, en 
tout point M, le gradient de w est colinéaire à OM. 


Vecteur Gradient et ligne de niveau 


Soit f(x,y) une fonction de deux variables et soit C la ligne de niveau passant par un 
point Mo=(x0,yo) donné. L'équation de C'est f(x,y)=k, où k=— f(x0,vo). Supposons 
qu’au voisinage de M5, on peut paramétrer la courbe C' par M(t) = (x(t),y(t)). Le 
point M, correspond à une valeur t, du paramètre, de sorte que (æ(to),y(to)) —(%0,Y0) 
et f(x(t),y(t)) = k pour tout t voisin de to. 


La fonction + f(x(t),y(t)) a pour dérivée Grad (M5) É (to) | =Grad;(Mo)- oe (to), 


F. 
t 
dOM y (ko) 
dt 


où le vecteur (to) est tangent à C en Mo. Puisque cette fonction est EE. 


au voisinage de {o, sa dérivée en {, est nulle, donc Grady(M) - CPL (to) = 0. 


> En tout point, le vecteur gradient est orthogonal à la ligne de niveau. 

— Si Grad/(Mo) 0, l'équation de la tangente en M à la courbe d'équation f(x,y)=Kk est 

of 
( 


Mo)(x—xo) + 2 (M)(y-u) = 0 
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Rappelons que le vecteur gradient en M pointe vers les YA 
niveaux supérieurs à celui de M (page 365). 

Sur la figure ci-contre, on a représenté, pour différentes valeurs ae 
de k, les ellipses d’équation (1/2)x°? + 2y? = k?. Ce sont des RARE "1 
lignes de niveau de la fonction f(x,y) = (1/2)x? +2y? et l’on 


voit des vecteurs Grad(x,y)=(x,4y) en quelques points. En un point (x6,yo) de l’une 


des ellipses, la tangente est orthogonale au gradient, donc a pour pente _— si yo 0. 
Yo 


Surface de niveau. Soit f(x,y,z) une fonction de trois variables et soit Mo — 
(to, Yo, 20). L'ensemble des points M =(x,y,z) tels que f(M) = f(Mo) est en général 
une surface S passant par M, : c'est la surface de niveau k = f(M5) et son équation 
est f(x,y,2) = k. 

Soit (x(t), y), 2(€)) une courbe paramétrée dérivable tracée sur S et passant au 
point Mo pour la valeur t, du paramètre. On a f{x(t),y(t),2(t)) = k pour tout t 


dOM 
use 
JM (to) 


et en dérivant, il vient comme ci-dessus Grad(M) — 0. Le vecteur gra- 


dient en A est donc orthogonal à tous les vecteurs tangents à la surface en Mo, 
c'est-à-dire au plan tangent en M. 

> En tout point, le vecteur gradient est orthogonal à la surface niveau. 

Si Grady (Mo) 0, l'équation du plan tangent en M à la surface d'équation f(x,y,z)=k 


Ce] Ô 5 
est 2 (Mo)(x—0) + SEM) (u yo) + L (Mo}(z—20) = 0. 


Exemple 

L'ellipsoïde de révolution d’axe Oz, de rayon r dans le plan xOy et de 
hauteur 2h a pour équation x? + y? + a?z? = r?, où a =r/h. L'équation 
de son plan tangent au point Mo = (to, Yo, Zo) est 


zo(t—%o) + Yo(Y—Y0) + a 20(2—20) = 0. 


3.4 Dérivées secondes 


Soit f:(x,y)r+ f(x,y) une fonction à valeurs réelles. La dérivée partielle of est 

A 
encore une fonction des deux variables x et y, donc est susceptible d’avoir des 
dérivées partielles. Ce sont des dérivées partielles secondes, que l’on note 


Ô (2-2 et (4) - Cu 

0x \ 0x dx? Oy \ x Oyox 
De même, il peut exister des dérivées partielles secondes 

0 (2) - dF 4 0 (2-5 

Ox \ dy Ox0y 0y \ 0y dy” 
En fait, l’ordre dans lequel on fait les dérivations ne compte pas, pourvu que la 
fonction f soit assez régulière (théorème ci-dessous) : dans ce cas, les dérivées mixtes 
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of _ of 
Oxr0y Oy0x 
of à ®f _ of 

dy? Oy0x Ordy 


sont égales et il n’y a que trois dérivées partielles secondes : Dr? 
TL 


Exemple. Par exemple, pour f(x,y) = x?y + 2xy°, on a 


of 0 p,2 2 2 Ÿf ] 3 2 
= ——|x 2x(3 = 2x +6 et = {2x 2y"| = 2x +6 
Ox0y A Lu ] Fe OyOx | y+ y] Le. 
Théorème de Schwarz. Si la fonction f(x1,%2,...,7h) a ses dérivées partielles 


®f _ ®f 
Ox;0T; Ox;0T; ‘ 
Laplacien et fonctions harmoniques 


En Physique, la recherche d’un potentiel conduit souvent à des fonctions f(x,y, 2) 


CAE PR RE A à 
tell Af =0, où Af — 
elles que Af où Af FE + D + 


secondes continues, alors 


est le laplacien : on les appelle des 


fonctions harmoniques. 


Exemples de fonctions harmoniques à deux variables 
Les fonctions e%? cos(wy) et e%? sin(wy) sont harmoniques. 
— Dans les coordonnées polaires (1,8), l'expression du laplacien de f est 


OT LA, Do 
or? TÔT r? 0? 
Au moyen de cette formule, on vérifie que si k est une constante, la fonction klnr est 
harmonique dans le plan privé de l’origine ; de même, si a et b sont des constantes, 
la fonction aô + b est harmonique dans le domaine défini par r > 0, 0 < 0 < 2x. 
- On utilise aussi souvent les fonctions harmoniques r" cos(k@) et rl sin(k0), où k 
est un entier positif ou négatif. Comme une somme de fonctions harmoniques est 
harmonique, les fonctions 5=?__, r* cos(k0 + x) sont harmoniques. 


=—n 


A 


H 


+ 


Les figures ci-dessous montrent des lignes de niveau pour les fonctions harmoniques 
V1(r,0) = (1/r)cos0, Va(r,0) = r? cos(20 + x/2) et Va(r, 0) = r cos(30). 


figure 1 figure 2 figure 3 
V_1= constante V2z= constante V3= constante 
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On peut interpréter V2 et V3; comme le potentiel-courant d’un écoulement plan non 
tourbillonnaire : les lignes de niveau sont les lignes de courant. La figure 2 illustre 
un courant entre deux cloisons rectilignes à angle droit (les axes); sur la figure 3, les 
cloisons, représentées par les asymptotes, forment des angles de 60 degrés. 


Une propriété utile : le laplacien reste invariant par rotation des coordonnées. 


Faisons en effet tourner les axes Ox,Oy d’un angle a. La nouvelle expression d’une 
fonction f(r,0) est g(r,0) = f(r.0+a) et dans la formule du laplacien en coordonnées 
polaires, f et g ont même dérivée par rapport à 0. La propriété est vraie encore dans 
le cas de trois variables. 


Pour des fonctions harmoniques en coordonnées cylindriques, voir l'exercice 9; en 
coordonnées sphériques, voir page 546. 


4. Extremum local 
Définition 
Soit f une fonction de n variables définie sur un domaine D CR” et soit À un 
point intérieur à D. On dit que f a un maximum local en À si l’on a f(M) < f(A) 
pour tous les points M € D assez proches de À; cela signifie : 
il existe un nombre r > 0 tel qu’on a f(M) < f(A) pour tout point M 
vérifiant d(A, M) < r. 


On définit de même la notion de minimum local. 


4.1 Conditions pour un extremum 


Supposons par exemple que f est une fonction des deux variables x et y et que f a 
un maximum local en (a,b). Pour tout nombre x assez proche 
de a,;on a f(x,b) < f(a,b). 

Ainsi la fonction d’une variable g(x) = f(x,b) a un maxi- 


mum local en a, donc sa dérivée g'(a) = DE tb) est nulle. 


Ox 
De même, la fonction h(y) = f(a,y) a un maximum local en 
b, donc h'/(b) = ——{(a,b) = 0. Géométriquement, ces propriétés 
of di 
dE (a, b) = dy (a,b) = 0 signifient qu’au point (a,b, f(a,b)) de la surface d’équation 


z= f(x, y), le plan tangent est horizontal. 


Condition nécessaire pour un extremum local. Si une fonction de n variables 
a un extremum local en un point À intérieur à son domaine de définition, alors en ce point, 
toutes les dérivées partielles de f sont nulles. 


Définition 
Un point où toutes les dérivées partielles de f sont nulles s'appelle un point 
critique de f. 
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Un extremum local de f est à chercher parmi les points critiques de f. 


Mais, comme dans le cas d’une variable, la fonction ne présente pas forcément un extremum 
en un point critique. Par exemple, la fonction (x,y) + x°+y% n’a pas d’extremum en (0,0) 
bien que ses dérivées partielles à l’origine soient nulles (voir page 273). 
Cherchons maintenant une condition permettant d'affirmer qu’il y a effectivement 
un maximum ou un minimum. 

Supposons que f(x,y) a des dérivées secondes continues et que le point (0,0) est 


intérieur au domaine de définition. Sur la droite passant par l’origine et dirigée par un 
vecteur non nul (h,k), les valeurs de f sont données par g(t) = f(th,tk). On a 


PE OT 

gÉ)=h Ba Hk) +R SE tte , et | 

mn _ p2 °F Ca Ti 
g (0) = RP ES (ER) ARE 7 (Eh R)-HK a (th, tk) 


Le développement limité à l’ordre 2 de g au point 0 s'écrit 


12 
g(#) = g(0) + tg'(0) + 9” (0) + o(#°). 
Supposons remplie la condition nécessaire pour que f ait un extremum local en (0,0), 


és pe 0 0 _ (0) = 
c'est-à-dire dx (0,0) aÿ (0,0) = 0. On a alors g/(0) = 0, donc 


2 
FR, tk) — F(0,0) = gt) — (0) = Lg” (0) + o(#°) 
On sait que pour t assez petit, cette différence a le signe de 
®f 
Ox0y 


Si par exemple g/”(0) > 0, cela veut dire que l’on a f(x,y) — f(0,0) > 0 pour tout point 
(x, y) assez proche de l’origine dans la direction (h,k). 


D Pf 
"(0) = h2 5 (0,0) + 2hk 0,0) + k? + (0,0). 
g”(0) 32 (00) (0,0) a ) 


Condition suffisante pour un extremum local 


Soit f une fonction de plusieurs variables ayant des dérivées secondes continues et 
soit À un point intérieur au domaine de définition. 


Cas d'une fonction de deux variables. Supposons que f est une fonction de 


ni of 07 
deux variables (x, y). Posons p D (A), q Drdy (À) et r = Er 
Proposition. Supposons 21(4) = 2 (4) =0et g —-rp<0. 


= Si p>0 ou sir >0, alors f a un minimum local en À. 
= Si p <0 ou sir <0, alors f a un maximum local en À. 
Démonstration. Supposons pour simplifier À = (0,0). D'après ce qui précède, pour que 
f ait un minimum local en À, il suffit que l’on ait ph? + 2qhk +rk? > 0 pour tout vecteur 


non nul (h,k). Lors de l'étude des produits scalaires dans R?, nous avons montré page 202 
qu'il en est ainsi lorsque p > 0 et q? — rp < 0. Remarquons pour finir que si q? —rp < 0, 
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alors rp est positif, donc p et r sont de même signe. Supposons p et r négatifs. On a alors 
— (ph? + 2qhk+7k2) = (-p}h? +2(-qhk+(-r)k? > 0, car —p > 0 et (—q)? <(—-r)(—-p). Par 
suite, la fonction —f a un minimum local en À, donc f a un maximum local en À. = 


En posant H — H et S — he d il vient ph? + 2qhk + rk? = (tH)SH. 


La proposition affirme que si la matrice symétrique S est définie positive, alors f a 
un minimum local en À. 


Cas où q? — rp > 0. Le trinôme pT?+2qT +7 ayant alors des racines réelles, il ne 
garde pas un signe constant et il en va de même de l'expression ph? +2qhk + rk? — 
k?[p(h/k)? + 2q(h/k) + r]. 


Si q—rp > 0, la fonction n'a pas d’extremum local en À. 


Exemple 1. La fonction f(x,y) = x?—y? a un point critique en 
(0,0) et l’on a ici p= 2, q =0 et r = —2, donc g — rp > 0. 

En tout point (x,0) différent de l’origine, on a f(x,0)=x?>0=f(0,0), et 
en tout point (0,y) différent de l’origine, on a f(0,y)=—y? <0= f(0,0) : 
il n’y a pas extremum local en (0,0). Autour de ce point, la surface 


d’équation z2=x?—? a la forme d’un col de montagne (voir page 21). 


Exemple 2. Soit f une fonction harmonique sur un domaine D. En appelant 
comme précédemment p,q,r les dérivées secondes en un point intérieur M, on a 
r = —p, donc q? — rp = q° + p°. Si p et q ne sont pas tous deux nuls en M, alors 
g —rp>0et f n’a donc pas d’extremum local en M. 

À moins d’être constante, une fonction harmonique n’a d’extremum local en aucun 
point intérieur de son domaine de définition : le maximum ou le minimum ne peut 
être atteint qu’en un point situé au bord du domaine. C’est ce qu'on voit sur les 
figures page 372. 


Cas d'une fonction de n variables. Soit f une fonction de la variable vec- 
torielle X — (x1,%2,...,æ,) et soit À un point intérieur au domaine de définition. 
Donnons-nous un vecteur non nul H = {(h1,h2,...,h,) et posons g(t) = f(A+1tH). 


2 
EOmnager?, hi SL (A +tH) et si l’on pose a;; = inde (A), alors 


g"(0) = > 0 aihÿ + D_okicjen 2aijhih; 


Introduisons la matrice S—{a;;]. C'est une matrice carrée de taille n qui est symétrique 


puisque @;; = a, d'après le théorème de Schwarz. Il vient alors g”(0) = (‘H)SH. 


2 


Ox;07; 


] Définition 


La matrice | (4)] s'appelle la matrice hessienne de f au point À. 
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2 
Le développement limité de g en 0 s'écrit g(t) = g(0) + tg'(0) + Lg" (0) + o(t?). 


Supposons que la condition nécessaire d’extremum est vérifiée, c'est-à-dire que les 
dérivées partielles premières de f sont toutes nulles en À. Dans ce cas, g'(0) = 0 et 


2 
f(A+tH)-f(A)=g(t)-g9(0)= 5 (CH)SH +o(t?).Si la matrice S est définie positive, alors 
(H)SH>0, on a f(A+tH)-—/f(A)>0 pour t0 assez petit et f a un minimum local en À. 


of 
Ôt; 
est définie positive, alors f a un minimum local en A. Si la matrice hessienne est définie 


Théorème. Supposons que 


(A) = 0 pour tout à. Si la matrice hessienne de f en À 


négative, f a un maximum local en A. 


4.2 Méthode du gradient 


Comme on ne sait pas, en général, résoudre analytiquement les équations permettant 
de trouver les points critiques, on utilise le plus souvent des méthodes numériques 
itératives pour trouver les extremums. La méthode du gradient est la plus simple. 
Supposons par exemple qu’on cherche un minimum local de f. 


Principe de la méthode. On part d’un point X9 et l’on calcule le gradient 
Grad(X0). Puisque le vecteur —Grad/(X5) indique la direction des niveaux décrois- 


sants, on se déplace à partir de X9 d’une longueur h>0 dans la direction —Grad(X5), 
h 

|| Grad; (Xo)| 

- on choisit un petit pas À >0 et l’on progresse à pas de longueur h dans la direction 


Vo = L Grad (Xo) en formant les points 


I Grad; (Xo)|| 
Xo1 = Xo + AV ; Xok4 = Xo,k + AV , pour R—12,:.; 
tant que f(Xok+1) < f(X0k). 


Si X1 est le dernier point Xon obtenu, on recommence en prenant X1 comme 


c'est-à-dire que l’on considère le point X5 — Grady (Xo). En pratique, 


point initial. En itérant ce processus, on obtient des 
points X0, X1,... de niveaux de plus en plus petits. 


Comme test d'arrêt, on peut prendre | Grads(X,)||<e, 
où € est un petit nombre donné. Le calcul s'arrête alors 
en un point où les coordonnées du gradient sont in- 


férieures à €, mais il n’est pas facile de contrôler 


sérieusement la précision obtenue. 


Pour la recherche d’un maximum, il faut bien sûr se déplacer dans la direction du 
gradient. 
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Exemple. La figure ci-contre montre des lignes de niveau 
de la fonction f(x,y) = (x? —y)!+xy° —4y?. Dans le domaine 
représenté, on voit qu'il y a deux extrema locaux en des 
points À et B situés aux environs de (1,2) et de (0,1, —1,4). 
En calculant quelques valeurs de f, on s'assure qu'il s’agit 
chaque fois d’un minimum local. 

Pour calculer les coordonnées de À, partons du point 
X0=(2,3). Avec h=10 7% et —107!, on obtient en onze itéra- 
tions le point de coordonnées 1,002, 2,004. Il est facile de vé- 
rifier que le minimum est en A=(1,2), de valeur f(A)=—7. 


— Cherchons les coordonnées de B en partant du point 
X0 = (1,—2), avec h — 10% et € — 10 2. En six itérations, 
on trouve le point (0,1211, —1,4376), proche du minimum 
local B = (0,12124:--,—1,43759...) où la valeur de f est 
d'environ —4,17. 


Extremum sous contraintes 


Dans le paragraphe précédent, nos conditions pour un extremum local en À sont 
valables quand les variables sont libres de parcourir tout un voisinage de A. Mais 
souvent, on cherche à rendre maximum (ou minimum) une quantité w=— f(x,y) quand 
x et y sont liées par une condition c(x,y) = k =constante, c’est-à-dire contraintes de 
rester sur la ligne de niveau k de la fonction c. 

Voici le théorème clef pour ce problème. Dans cet énoncé, g est une fonction de 
n variables (n > 2) à dérivées partielles continues et A est un point intérieur au 
domaine de définition de g. 

og 
d. (4) # 0. 
Alors au voisinage de À, les solutions de l'équation g(x1,2%2,...,%n) —0 sont données par 
Tn = P(T1,...,En-1), OÙ Y(t1,...,Xn_1) est une fonction à dérivées partielles continues. 
dp 


Ti 


Théorème des fonctions implicites. Supposons que g(A)—0 et que 


Si A=(a,a,...,an), alors an = @(a,...,@n-1) et la fonction dérivée partielle 


0g ,. 0g de 
dx: (Bi,2,Œn) + EPA Ds 


satisfait la relation (Di,ss Tin) (t1,...,Tn-1) = 0. 

Dans la plupart des cas, il est impossible de résoudre explicitement l'équation 
g(t1,%2,...,2n) 0 en exprimant x, en fonction de 21,...,2,_1 : le théorème affirme 
que, sous certaines conditions, cela est pourtant théoriquement possible. On dit que 
la fonction est implicite. 


Pour tout (71,%2,...,1,) voisin de À, on a 


get “ee ., Tn—1, P(T1, AE Bt) = 0 


CHAPITRE 12 - FONCTIONS DE PLUSIEURS VARIABLES -— 377 


0g Ôg 0p 
Ôt; Ütn Ôt; 
(A) Z 0, cette égalité permet de calculer la i-ème dérivée partielle de & en À. 


En dérivant cette identité, il vient 0 — 
La 
tn 
La figure ci-dessous illustre le théorème dans le cas d’une fonction g(x,y) de deux 
variables. 


(X) + 


(X) 


(t1,...,%n_1). Puisque 


C'est la courbe d'équation g(x,y) = 0 et le point À est sur C. 
— Puisque Grad,(A) = (4), Ze (A)), la condition (4) Z 0 signifie que le 
gradient en À n’est ni nul, ni horizontal. 

Comme on le voit sur la figure, si l’on reste au voisinage 
de À, alors pour x fixé, il y a sur la courbe exactement un 
point d’abscisse x. C’est donc qu’autour de À, la courbe 
C'est le graphe d’une certaine fonction (x). 

Au point B au contraire, la tangente est verticale, donc 
0g 
dy 
même abscisse, C n’y est pas le graphe d’une fonction de x. 


(B) = 0. Comme autour de B on peut trouver deux points de la courbe ayant 


Cependant, autour de B, la courbe est le graphe d’une fonction de y, car _ (B) £0. 
A 


Exemple. Le graphe ci-contre représente la courbe d’équation x +2y—2r-3y+2=0. 


Elle passe au point A — (1,1) où l’on a 09, 1)=5.Ilya donc y 


Oy A 
une fonction implicite 4 telle que, pour x voisin de 1, la courbe 
ait pour équation y= (x). La tangente en À a pour pente w'(1) = 
2 (1, D/SE CL. 1) = = et l'équation est y—1 — —(2/5)(x—1). 
1 x 


Justification du théorème. Supposons 28.(4) > 0. Puisque la fonc- 
tion " est continue, on a encore a y) > 0 pour (x,y) assez proche de À. Cela signifie 
que si x est assez proche de a, la fonction y + g(x,y) est strictement croissante au voisinage 
de b. En appliquant cette propriété à la fonction y g(a,y) qui s’annule par hypothèse en 
y = b, on en déduit g(a,y) < 0 si y <b et g(a,y) > 0 si y > b, du moins pour y assez proche 
de b. Choisissons de tels nombres yo < b < y1. Comme g est continue, on a encore g(x,yo) < 0 
et g(x,y1) > 0 pour x assez proche de a. Soit x une telle valeur. La fonction y g(x,y) 
étant continue et strictement croissante au voisinage de b, on en déduit, par le théorème des 
valeurs intermédiaires, que l'équation g(x,y) = 0 a une unique solution; celle ci dépend de 
æ : on la note (x) et l’on montre que la fonction x + (x) ainsi définie est dérivable. 


5.1 Recherche d'un extremum sous contrainte 


Extremum sous une seule contrainte 
Le problème : rendre maximum (ou minimum) la quantité w — f(x1,%2,...,%h) 
quand les variables sont contraintes de satisfaire la relation g(æ1,%2,...,1n) = 0. 
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On suppose que f et g ont des dérivées partielles continues et que l’on a Grad,(X)0 
en tout point X satisfaisant la contrainte g(X) = 0. 


Une condition nécessaire. Pour que w = f(X) soit maximum (ou minimum) en A 
sous la contrainte g(X)=0, il faut que les vecteurs Grad (A) et Grad, (À) soient colinéaires. 
Démonstration. Supposons qu’il y a trois variables x,y,z et que le point À = (a, b,c) est 
une solution du problème d'optimisation de w = f(x,y,z) sous la contrainte g(x,y,z) = 0. 


Par hypothèse, le vecteur Grad,(A) est non nul : supposons par exemple o (A) #0. D'après 


le théorème des fonctions implicites, la condition g(x,y,z) = 0 s'exprime au voisinage de À 

par z = (x.y). Alors la fonction (x,y) + f[x,y,w(x,y)] a un extremum en (a,b), donc 
of of ,, de of Of «4,0 

1 A A ,b) = 0 — À) + À b 

() GE (A) + SEA) RE (ab) = 0 = SE (A) + SE (A) TE (ab) 

D'autre part, on sait que les dérivées partielles de & en (a,b) vérifient 
0g 09 14,98 0g 09 4,98 

2 A) + A ,b) = 0 = À) + A ,b 

(2) 7e (A) + SEC) SE (a,0) = 0 = PE (A) + SEA) SE (at) 


De (1) et (2), on déduit qu’au point À, on a les deux premières relations suivantes, la 
troisième étant une identité : 


0g 0f _ Of dg 


0:07 0:07 ù 

0g 0f Of 0g 0 

Oz Oy Oz 0y 

0g 0f Of 0g 0 

Oz 07 Oz dz 
Ces égalités s’écrivent vectoriellement sous la forme og (A) Grad/ (A) — _ (A) Grad, (A) = 0. 
Puisque 28.(4) Z 0, les vecteurs Grad;(A) et Grad,(A) sont colinéaires. = 

2 


Extremum à trois variables sous deux contraintes 

Le problème : rendre maximum (ou minimum) la quantité w — f(x,y,z) quand les 
variables sont contraintes de satisfaire les relations g(x,y,z) = 0 et h(x,y,2) = 0. 
Supposons à nouveau que f, g et h ont des dérivées partielles continues et qu’en 
tout point X satisfaisant les contraintes g(X) — 0 — A(X), les vecteurs Grad, (X) et 
Grady(X) sont indépendants. 


Une condition nécessaire. Pour que w = f(x, y,2) soit maximum (ou minimum) 
en un point À sous les contraintes g(x,y, 2) = h(x,y,2) = 0, il faut que le déterminant 
des vecteurs Grad(A), Grad,(A), Grad; (A) soit nul. 


Démonstration. Supposons que w est extremum en À et que l'indépendance des vec- 
teurs gradients de g et de h en À est assurée parce que les deux dernières coordonnées 


de Grad,(A) et Grad;(A) ne sont pas proportionnelles : autrement dit, on suppose que le 


nombre d = 2 (A) al (A) oh (A) _ (A) n'est pas nul. 
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Si par exemple us (A) Z 0, alors au voisinage de À, la condition g(x,y,z) = 0 s'exprime sous 
2 


la forme z = w(x,y). On en déduit que u(x,y) = h[x,y, p(x,y)] = 0, où la fonction 4 vérifie 


2 n = D Au point ÀA,ona # (2 À oh e) — d. Le terme entre parenthèses est = 
Ou 


et puisque d£0, on en déduit Su (A) 0. Au voisinage de À, la relation u(x,y) =0 s'exprime 
y 


donc par y=p(x). Finalement, les deux contraintes s’écrivent y=p(x) et z=w(x,p(x)) =q(x). 
Pour tout x assez proche de l’abscisse a de À, on a ainsi identiquement 

w = flx,p(x),a(x)] , glr,p(x),a(x)] =0 et hfx,p(x),g(x)] = 0. 
Quand x varie, w est extremum en a, donc la première fonction a une dérivée nulle en a; 


les deux autres fonctions sont constantes (de valeur 0) au voisinage de a, donc leur dérivée 
en à est nulle également. Tout cela s'écrit : 


OÉ (4) + LL (4) (a) + 2 (A 


3x En r, (4)q(a) =0 
0g 09 (ay 09 49 
—— (A) + (A + (A = 
GE (A) + SCA) P/(a) + SE (A)d/(a) = 0 
Oh Oh / oh / 
(A) + (A + (A = 
2n.(A) + D (A) p'{a) + D (A)d (a) = 0 
Ô 0 Ô 
- ( a! (4) ci 4 
4 “e ra tGrady(A) 
On voit que les colonnes de la matrice . (A) : (A) : (A) | = rs ne sont 
Ox y Oz tGrad (A) 
Ox y Oz 
pas indépendantes. Le déterminant des vecteurs gradients est donc nul. î 


Exemple : stratégie de consommation. Étant donné un panier de trois biens 
B1, B2 et B3 en quantités +1, 2 et 2, l'utilité du panier est U(x1,72,%3) = mains, 
Ce nombre est un indice de satisfaction du consommateur après achat. Les exposants 
a,b,c sont des nombres positifs (choisis en général tels que a+b+c=1). 

Si p1, p2 et pa sont les prix unitaires des biens, la dépense occasionnée par l'achat 
du panier est p171 + P2T2 + P3T3. Supposons qu'un consommateur dispose pour cet 
achat d’un revenu À. On constate qu'il va y dépenser tout son revenu en choisissant 
les quantités qui rendent maximum l'utilité. La détermination des quantités achetées 
se formule donc ainsi : 


trouver %1,2%,%3 rendant maximum U(x:1,29,23) quand pti + pate + pates = R. 
La contrainte sur les variables s'écrit 
g(t1, to, ts) = 0, où g(x1, 22, T3) = Pit + Pate + parts — R. 


Le gradient de g est donc Grad, = (p1,p2,p3). Calculons le gradient de U : on a 
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et de même 2Ù — D U(x,2,%3), ou = CU(x1,%2,t3), d'où 
Oxo To Ot3 T3 


Aa b 
Grady(x1. To, ta) = U(x:, To, T3) (2. Er c) 
T1 L2 3 

Pour que les gradients de g et de u soient colinéaires, il doit exister un nombre À tel que 
a b C 
B=À- ,; B=À-- , p=À- 

EA T2 T3 
Il vient alors pit —=A@, pro À, pst3—Xc ; en ajoutant, on obtient R=pixi+prtI+p3t3— 


X(a+b+c) et À = | Finalement, la solution est 
a+b+c 
= AR = 0R = CR 
mila+b+c) pla+b+c) ” ps(a+b+c) 


Interprétation géométrique dans le cas de deux biens. Dans le cas de deux biens, 
la figure ci-contre montre la droite D d’équation p1t1 + p22œ2 = R et des lignes de 
niveau de la fonction U(x1,x2) = x%xb. 

Si une courbe de niveau k coupe D en deux points, on voit qu’il y a sur D des points 
de niveau supérieurs à k : ces points d’intersection ne sont 
donc pas solution. Ainsi, la solution est géométriquement le P 
point À de D où la ligne de niveau de U est tangente à D.  R/m 
En un point (1,22), le gradient de U est orthogonal à la 

ligne de niveau de U et le vecteur (p1,p2) est orthogonal à 

D. Le point À se caractérise donc bien par le fait que les | Rn à 


U(xi,2%) = k 
k3<k<k; 


vecteurs Grady(A) et (p1,p2) sont colinéaires. 


5.2 Une application statistique : le krigeage 


Cette méthode d'estimation statistique, initiée par D.G. Krige, est très utilisée dans 
les Sciences de la Terre (Géologie, Océanographie) et dans la recherche minière. Nous 
en présentons la théorie, puis l'aspect pratique. Voici d’abord quelques définitions. 


Espérance et Covariance. Si U est une variable aléatoire, rappelons que l’on 

note E(U) l'espérance de U, si ce nombre existe (définition page 329). Soient U et 

V des variables aléatoires. 

Si U et V ont une espérance, alors E(U + V) = E(U) + E(V). Il s'ensuit que la 
variable aléatoire U—E(U) a une espérance nulle : on dit que U est centrée. 

— L'espérance E[(U — E(U))(V — E(V))] s'appelle la covariance de U et V et se 
note Cov(U, V). On a donc aussi Cov(U, V) = E(UV) — E(U)E(V). 

— La variance de U est le nombre Cov(U,U) = E|(U — E(U))"| = E[U? - E(U)|. 

Pour les variables centrées U=U-—E(U) et V=V-E(V),ona Cov(U,V}=Cov(U,V}), 

cat (D) =E(V) =0: 

Nous montrerons page 407 que si U et V sont indépendantes, alors Cov(U, V) =0; 

mais la réciproque n’est pas vraie. 
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Les données et le problème 


Soit Z une fonction aléatoire, c’est-à-dire une famille de variables aléatoires Z(x) 
dépendant d’un paramètre x. Faisons une première hypothèse. 

Hypothèse (a) : Pour tous x,y, on a E[Z(x) — Z(y)] 0, autrement dit les variables 
aléatoires Z(x) ont toutes la même espérance m. 

Par définition de la covariance (supposée exister), on a alors pour tout x : 


(1) Cov( [Z(x), Z(x)| — E[Z(x)] — m? 
Donnons-nous n valeurs 21,%2,...,%, du paramètre et les variables aléatoires Z(x:), 
Z{(x2),...,Z(xn) correspondantes. 


Le problème : À partir de cette donnée, trouver une estimation Z* de la variable 
aléatoire Z(x0), où x0 est une valeur du paramètre ne figurant pas parmi %1,72,...,n. 


Exemple. Typiquement, Z(x) est la teneur en minerai en un point x d’un gisement. 
On a prélevé des échantillons aux points %1,%2,...,1n et mesuré des teneurs 
z(x1),2(22),...,2(æ). Le but est de faire la meilleure estimation statistique de la 
teneur 2(x9) au point x. L'hypothèse (a) traduit une homogénéité dans les résultats 
de ces mesures, c'est-à-dire une certaine régularité géologique du bassin étudié. 


Cherchons l'estimation Z* sous la forme Z* = ÿ 5, A4Z(xx), où les nombres À4 

vérifient Fin Ag = 1; on définit ainsi une nouvelle variable aléatoire Z*. 
Justifions la condition sur les coefficients inconnus À1,...,À, : puisque l'espérance d’une 
somme est la somme des espérances, l'espérance de Z(x0) — Z* est E[Z(xo) — Z*] = 
E[Z(x0)] - Xi; AE [Z(xx)] =m — (SX, Àx) m, car toutes les variables aléatoires 
Z(x) ont même espérance m. Comme Z* doit être une estimation de Z5, cette espé- 
rance doit être nulle (on dit que l'estimation est sans biais) ; pour que cela soit vrai quel 
que soit m, il faut, d’après l'égalité ci-dessus, que la somme des À} soit égale à 1. 


Si l’on peut choisir les coefficients À; de manière que Z{(x0) — Z* ait une variance 
v minimale, la variable aléatoire Z* est une bonne estimation de Z{(x0), par rapport 
à l'information connue. Puisque la somme des À4 vaut 1, l'espérance de Z{(x6) — Z* 


est nulle, donc v=E L(Z (to) — Z Y . Le problème se formule ainsi : 
trouver des coefficients À; rendant minimum la variance v = E|(Z{x0) — z'}°|. 


Posons Z(x0)=Z(x0)-m et Z(xx)=Z(xx)-m. Puisque 35, A4=1,ona D, Ar Z(tr)= 
Z* —m, donc 


Z{xo) — Z* = (Z(xo)-m) — (Z*-m) )-S 2 AZ (xx) 
En développant le membre de droite, il vient 1 
(Z{x0) — 7°)? = Z(x0) +257 (to) Z(ax) + D XX Z(x)Z(x;) 
ii 
E[Z(«0)°] 1-25 urtz Z{xx)] + SX E[Z(x:)Z(x;)] 
ii 
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(2) v = Cov{[Z(x0), Z(&0)] — 29 XX Cov[Z(x0)Z(æx)] + SA; Cov[Z(x:)Z(x;)] 


k=1 ii 
La variance v est fonction des n variables (À, 2,...,À,) liées par la condition 
902... An) = À +++ = 1. 


Pour que v soit minimum, il faut donc que les vecteurs Grady — 1 2 x. ; 2 . js = ) 
et Grad,— ( we : w de. we ) —(1,1,...,1) soient colinéaires. Calculons les dérivées 


partielles de w : 


= —2Cov[Z(x0), Z(xx)] + 2» À; Cov[Z(xx)Z(x5)] 


Les gradients sont colinéaires si et seulement s’il existe un nombre y tel que 
(3) ÿ Xj Cov[Z(xr)Z(x5)] — Cov[Z(xo), Z(xx)] = 4 , pour tout k=1,2,...,n 
j=1 


Écrivons cela sous forme matricielle. En posant c;; — Cov[Z (x:)Z (x;)], les égalités 
(3) et la relation À + À2 +:--+ À, — 1 se mettent sous la forme 


C1 C12 °° Cin 1 À Col 
C21 C22 *** Con 1 À2 Co2 
(2) li l=l: 
Cn1i Cn2 ‘‘' Cnn I Àn Con 
1 1... 1 0 —u 1 
La matrice ci-dessus est symétrique, de taille n +1. On voit que les coefficients incon- 
nus À,...,), et y sont solutions d’un système linéaire. Cependant en pratique, les 


covariances c;; ne sont aisées à déterminer directement. Pour continuer les calculs, 
faisons une hypothèse supplémentaire. 

Hypothèse (b) : pour tout h, la covariance Cov{Z(x), Z(x + h)] ne dépend que de 
h (hypothèse de «stationnarité »). Posons C(h) = Cov[Z{x),Z(x +h)|. 


Exemple. Si Z(x) est la teneur en minerai au point x d’un gisement, l'hypothèse 
(b) traduit le fait que l'influence exercée en un autre point y par la richesse en mi- 
nerai en x ne dépend pas de la position de x, mais seulement du vecteur (ou de la 
distance) } représentant le déplacement entre x et y. Il faut définir convenablement 
le bassin pour pouvoir considérer que cette propriété est à peu près vérifiée. En 
général, la covariance C(h) diminue quand |h|| augmente. 


Comme conséquence de l'hypothèse, on trouve que la variance de Z{(x) est C(0) = 
Cov{Z(x), Z(x)], un nombre indépendant de x. L'égalité (1) s'écrit ainsi 


(1°) E[Z(x)] = C(0) + m° 
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Le demi-variogramme. Avec la notation Z{(x) = Z(x) — m, on a Z(x) — Z(+h) = 
Z{(x)—Z(x+h) ; en développant le carré et en prenant l'espérance, on obtient d’après (1’) 


E |(Zto SA n)°] = 


E[Z(x)] + E[Z(x + h)°] -2E[Z(x)Z(x +h)] 


= 2C(0) — 2C(h). 


On définit le demi-variogramme en posant 


v(R) = 1E|(Z() = Z(8+ D) = C(0) — C(h), pour tout h £ 0. 


On a C(—h) = C(h) et donc y(—h) = y(h). 


En Géologie, la fonction y permet de quantifier la notion de zone d'influence d’un 
échantillon : la covariance C(h) diminue quand |h|| augmente, donc y(h) est fonc- 


tion croissante de |h|| : son taux de croissance mesure la diminution d'influence d’un 


échantillon de terrain sur des zones de plus en plus éloignées. 


Quand |h|| est assez grand, il n’y a plus d'influence 
entre les points x et x +h de sorte que la cova- 
riance C(h) est presque nulle : 
pour |h|| suffisamment grand. Le demi-variogramme 
expérimental présente ainsi un palier horizontal à par- 
tir d’une valeur |h| = a appelée portée. 

Quand h tend vers 0, on constate souvent expérimen- 
talement que 7(h) tend vers une valeur strictement 


on a y(h) = C(0) 


un demi-variogramme 
expérimental 


positive, et non pas vers Ü comme pourrait le laisser 


croire la définition théorique. En réalité, la décroissance de y(h) est très rapide quand ||h|| 


est de l’ordre du diamètre moyen des grains du minéral considéré : à l'échelle des dis- 


tances entre les sondages effectués, on observe une discontinuité en h=0 (effet « pépite »). 


Les équations du krigeage 


Pour 0 <i,j <n, posons Y;; = = 


—V cr; = C(0 D j » car DE =] 


= C(0) — Cox — 4 = Vox — 4, d’après (3) 


Finalement, en posant 


Yu 922. Vin A oi 
921 922 °°" V2n 2 702 

Az |: , ÀA=!|: ét B=|:: 
Yn1 Yn2 ‘°° Ynn il Ân Von 

1 1... 1 0 Li 1 

les coefficients À1,...,À, s’obtiennent en résolvant le système linéaire 


(5) 
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Si l’on prend pour x, l’un des points x, de {x1,...,æ,}, la solution Z* est Z(x,) : 
l'estimation est donc sans biais. Il reste à déterminer les coefficients du système. 


Évaluation des coefficients de la matrice. Supposons que U est une variable 
aléatoire et que (uw1,u2,...,un) est une réalisation de U, c'est-à-dire les résultats 
de N expériences. Si N est assez grand, la moyenne D u;, appelée moyenne 
observée, est une estimation statistique de l'espérance de U. 
Dans notre cas, on ne dispose en général en chaque point x, que d’une réalisation 
z(xx) (résultat de l’analyse du prélèvement en xx). Mais considérons pour h donné, 
tous les couples de points %,,x, choisis parmi 21,...,1, et tels que 2, — xp = h. 
Toutes les variables (Z(x,) — Z(x3)) ont la même espérance 2y(h), donc s’il y 
a N(h) couples de points, on a 2y(h) — nm #70) _ ACL En 
prenant comme seules réalisations les z(x,) et si N(h) est assez grand, on pourra 
néanmoins adopter la moyenne des (2(x,) — 2?) comme valeur de 27y(h). 
C’est ainsi que l’on évalue les nombres 7;;. Soient x; et x; deux des points 21,%2,...,2%n 
et soit h — x; — x;. Faisons la demi-moyenne des nombres (z(x) — z(&))”, où les 
points x, et x, sont pris parmi æ1,...,2%, et vérifient x, — x, — h, autrement dit, 
adoptons la valeur empirique 
2 
= gg 2 oz) 
Ta—Tp=h 
avec h = x; —x;, la sommation se faisant sur les N(h) couples (x,,x,) tels que 
La—Tp = À. 
Le demi-variogramme (h) est alors connu pour les valeurs h=x;—x:, où 1<i,j<n. 


Par exemple, si les points 71,...,2%, sont alignés et régulière- 
2 2 : . . . e LA e LA e- e 
ment espacés (échantillonnage dans une veine de minerai), alors x 2, 2 1 2 2 
1 tt 2 a 
V2 = 923 = — Yn-in 2{(n—1) he: (z(&o+1) — 2(&2)) 


Pour que la somme contienne un nombre suffisant de termes, on se donne en général 
une tolérance € sur la valeur de h ; ainsi lorsque À est une distance, on fait intervenir, 
dans le calcul de la moyenne, les points tels que h—Ee<2x,—21,<h+Ee. 


Évaluation des coefficients du second membre. Puisqu'on cherche une es- 

timation de Z(x) en un point x différent de x1,...,1,, les nombres + ne font en 

général pas partie des valeurs +(h) précédemment déterminées. On effectue donc une 

interpolation à partir des points connus du demi-variogramme, par exemple au moyen 

d’une fonction spline (page 350). Cela fournit une formule analytique pour la fonction 

7y(h), valable pour tout h, et pour ox, on prend comme valeur 0x = 7(%0—%x). 
En Géologie, on utilise souvent des formules adaptées à chaque type de demi-variogramme 
et dont l'efficacité est confirmée par l'expérience : cette interpolation constitue la partie 
délicate de la méthode. 
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Calcul final. Une fois déterminés tous les i,; pour 0<i,j<n, la résolution du sys- 
tème linéaire (5) donne les coefficients A,)2,...,X, et l'estimation 2*=5 7}, Ax2(1x) 
de Z(x0). 

Calculons la variance minimale v,5, ainsi déterminée. D’après les égalités (3), on a 
De Ad = De Ari + D Aro = +) x AxCor, puisque la somme des À4 
vaut 1. En reportant dans (2), il vient alors 


Umin = Cov[Z(x0), Z(xo)] — 2 Ÿ Axcox + + D Axcoe = C(0) — Ÿ Axcor + pi 
k=1 k=1 k=1 


et en tenant compte de Cox = C(0) — 4x, on obtient Unin = 41 À ok + pi. 


Si À est le vecteur solution de (5), alors Vin — (A)B. 


Supposons par exemple que l'erreur d'estimation Z* — Z{x0) est distribuée autour de la 
vraie valeur selon une loi normale. Alors la probabilité pour que |Z #—Z (xo)| < /Umin 
est d'environ 0,68 et la probabilité pour que |Z *—Z (xo)| <24/0min est d'environ 0,95 
(voir page 335). 


Intégrales à paramètre 


Soit f(t,x) une fonction à valeurs réelles. En l’intégrant par rapport à { sur un 
b 
segment [ab], on obtient la fonction F(x) — J f(t,x) dt de la seule variable +. Nous 
a 
allons voir que si f est assez régulière, alors la fonction F est dérivable et que F'(x) 
se calcule en « dérivant sous le signe intégrale ». 
of 


Dérivation sous le signe intégrale. Si les fonctions f et 3 Sont continues, alors 
A 


_ (f'itoa) -f Of (2 dt 


La démonstration fait appel à une propriété des fonctions continues : 


si @(t,h) est une fonction continue et si g(t,0) = 0 pour tout t € [a,b], 
alors a [p(é, h)| tend vers 0 quand h tend vers 0. 
1tEla, 


Démonstration. Par définition de 2 (, xo), On a 
T 


b b 


F(xo + h) — F(xo) = | LF(, to + h)—/f(é, to)] dt = | En D (bo) + h)] dt, 


où g(t,h) est continue et w(t,0) = 0. Il vient donc 

b9f b 
F(xo + h) — F(xo) = | SE (bo) dt + h | Q(t, h) dt 
[22 JT a 
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D'après les propriétés de l'intégrale, on a 


b b 
| ele nat <] (PC, h)| dt < |b-alm(h), où m(h) = max |w(f, h)| 
a Ja tele, 


b 
La propriété énoncée ci-dessus affirme que lim m(h)=0. Quand h tend vers 0, h Î o(t,h) dt 


h—0 
b 
est donc négligeable devant h. Par définition de la dérivée, cela veut dire que Î SL (té, xo) dt 
a TL 


est la dérivée de F en «so. = 


Exemple d'optimisation en biométrie. Environ un quart d'heure après la pose 
d’une perfusion, la quantité d’une substance thérapeutique présente dans l'organisme 
varie en fonction du temps (compté en heures) selon la loi qg(t)=ae °?!-—bet$t, où a 
et b sont des paramètres dépendant des quantités initiales et sur lesquels on peut agir. 
L'efficacité maximale est obtenue lorsque la quantité de produit reste assez longtemps 
voisine d’une valeur optimale m. On mesure donc l’action sur une période de temps 


T 2 
T' par la fonction de contrôle J = j [a(t) — m] dt. 


Le problème : trouver a et b pour que J soit minimal. 
Calculons les dérivées partielles de J par rapport à a et à b en dérivant sous le 
signe intégrale. On a 

o 2 0q =0$ 

2 [(4-m) | = 2(q()-m) = 2(q(t) — m)e ?* 

T T 

2 F8 [-m)lu-2f 
o0a 0 o0a 0 


=5(1-e To (-e 2T)b+10(e %?T - m) 


(ae ME = be # me Wt) dt 


De même, 
oJ _ [” 2 . ; 
= q(t) m | dt = 2 | (—ae” t + be? t + met * dt 
ob | ob [ ) : 
= (Ge Tja+ (1 — e 67) IDçe-t8T = 


Pour que J soit minimum, il faut que ces deux dérivées partielles soient nulles. 
Supposons qu’on veuille exercer le contrôle sur cinq heures. On doit alors résoudre 
le système linéaire suivant aux inconnues a et b : 


{ 5(1— e ?)a — (1—e )b = 10(1 — e l}m 
Of) OL 6 Pb AOÛ 6”) 


La solution est environ a=1,71m et b=1,08m. Calculons les dérivées secondes de J : 


2 2 2 
=ss(-e), gs = (et) ?),r= Pi = (ie 5) 


P da? d0adb 9 
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On a g’—rp<0 et p est positif, donc la fonction J atteint bien son minimum pour ces 
valeurs de a et b. Voici le graphe de la fonction q(t) ainsi déterminée (on a pris m=1). 


tr q(t) 


T > 

Put t 

Sur la courbe, la partie décroissante qui intervient après environ une heure de 
traitement correspond à une phase d'élimination par l'organisme. 


Enonçons pour finir les conditions qui permettent de dériver sous le signe intégrale 
généralisé. 


Dérivation sous le signe intégrale généralisé. Supposons que les fonctions f 
et L sont continues et que l'intégrale généralisée ou f(t,x) dt existe. S'il y a une 
fonction g(t) telle que 22 (6,2) < g(t) pour tout t et tout x, et si l'intégrale généralisée 
[7 g(t) dt existe, alors on a 2 LT FC, x) dt] = pe a! (t, x) dt. 


a dx HE 


Linéarisation locale d'une transformation 


Le problème. Considérons une transformation F de R?, c’est-à-dire une fonction 
F:(x,y) + F(x,y) de deux variables, où F(x,y) = (u(x.y),v(x,y)) est dans R?. 
Supposons que cette transformation a un point fixe Xo, autrement dit F(X6) = X0. 
On voudrait comprendre comment sont transformés les points voisins de X5. 

Pour simplifier, nous supposons que X0— (0,0) (on se ramène à ce cas en considérant 
la transformation X + F(X+X65)-F(X0) ). 

Notre objectif est de trouver de nouvelles coordonnées dans lesquelles la transfor- 
mation s'exprime plus simplement. Commençons par le cas où F est linéaire. 


Cas d'une transformation linéaire. La transformation s'écrit F(X) = AX, où 
À est une matrice carrée de taille 2. Rappelons comment faire un bon changement 
linéaire de coordonnées (pages 186-188). 

Supposons par exemple que la matrice À a deux valeurs propres réelles À et u 
distinctes. La matrice P des vecteurs propres étant inversible, nous pouvons faire le 
changement de coordonnées X — PU. Dans les nouvelles coordonnées U = (u,v), 
la transformation X'— AX s'écrit U! = PIX! = P-1AX = P-lAPU = DU, où D 
est la matrice diagonale diag(\, 1). Les formules de transformation deviennent donc 
simplement w = Àu , v' = pv. 
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Changement linéaire de coordonnées. Prenons une transformation X'=F(X) 
dérivable telle que F(0,0)— (0,0) et supposons que la matrice jacobienne A=—Jx(0,0) 
a deux valeurs propres réelles À et y distinctes. Faisons comme ci-dessus le chan- 
gement de coordonnées X = PU, où P est la matrice des vecteurs propres de À. 
Dans les nouvelles coordonnées, la transformation s'écrit U' = G{U), où 


CDR EP Tr) = PERD) 
Soit p: R? — R? l'application linéaire bijective définie par p(U) = PU. La matrice de 
la bijection réciproque p ! est Pl, donc G{(U) = (p lo Fop(U). Si P = fs ël 
alors pour tout U = (u,v), on a p(U) = (au + Bu, yu + Ôv) et la matrice jacobienne 
de p est J, — P. Puisque p_! a pour matrice Pl, on a de même J,1 = P |. La 


matrice jacobienne d’une composée étant le produit des matrices jacobiennes (page 
367), il vient JG (0,0) = J,1AJ, = PAP = diag(X, y), autrement dit 


R? —— Rp? X—— x! 
Ja(0,0) — É ;] pl | pt p D! 
R? —— R? U —— 


Par le changement de coordonnées U = P7'X, on obtient une transformation 
G dont la matrice jacobienne au point fixe est diagonale. 


Changement non linéaire de coordonnées. Reprenons la transformation X'= 
F(X) et faisons un changement de coordonnées U = &(X) bijectif, où X — (x,y) et 
U = (u(x,y), v(x,y)). Supposons que : 

i) (0,0) = (0,0), 

ï) & et w | ont des dérivées partielles continues, 


ïüi) J, (0,0) — É 1 = JL. 


La dernière propriété signifie qu’au voisinage de l’origine, on a u(x,y)=æ+0(||(x,y) ||) 
et v(x,y) = y+o(I(x,y)|l). 


Puisque la composée w-! 04% est l'identité, on a J.,-1(0,0)J,,(0,0) = 12, ou encore 
J,-1(0,0) = B. 

Dans les coordonnées (u,v), la transformation s'exprime par des formules U’ = G{U) 
telles que U'=p(X')=(v0F)(X)=(poF)(#"t(U)), donc G=poFoypt. Comme pré- 
cédemment, on en déduit que la matrice jacobienne de G en (0,0) est Ja =J,JrJ,-1 = 
LJrls = Jr. 


Ce changement de coordonnées ne modifie donc pas la matrice jacobienne en (0,0). 
En particulier, les valeurs propres et les vecteurs propres sont inchangés. 
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Vers la linéarisation. Limitons-nous maintenant à une transformation F poly- 
nomiale : cela veut dire que (x’,y) = F(x,y) est de la forme 


z'=ar+by+ Ro, y)+Ra(a,y)+- + Roxy) , y'=cx+dy+So(x,y)+: +5, (x,y) 


N : 2 È : 
où Ro (x, y) —= 20%? + TT Yy + ro2Y?, Ra(x, y) = 1307? + TL y + TL2TY + ro3Y, etc. Faï- 
sons d’abord, comme précédemment, un changement linéaire de coordonnées pour 
que la matrice jacobienne devienne diagonale, à coefficients les valeurs propres À et 


u de Jr(0,0) = É A . Nous sommes maintenant ramenés à des formules pour x 


et y de la forme 


(D) 2 = Ar+ Roxy) + Ra(a,y) ++ Rae, y) Y=uy+So(2,y) ++ Sn(x,y) 
Nous allons chercher un changement de coordonnées (u,v)=4(x,y) polynomial ayant 
les propriétés indiquées au paragraphe précédent et tel que, dans les coordonnées 
(u,v), la transformation s'exprime par 
(u',v') = (Au, uv)+termes de degrés supérieurs à N. 
Si N est choisi assez grand, les termes de degré supérieurs à N seront très petits au 
voisinage de l’origine et la transformation (u,v) - (u/,v') sera ainsi très proche de 
la transformation linéaire L(u,v) = (Au, av). De plus, nous savons que les valeurs 
propres et les vecteurs propres de L sont ceux de la transformation X + Jr(0,0)X, 
c'est-à-dire de l’approximation linéaire de F à l’origine. 
Nous avons déjà fait un tel changement de coordonnées dans l'exemple 3 page 26. 
Cherchons les fonctions « et v sous la forme : 
u=x+ Ur, y) +Ua(e,y) + +Un(a y) , v=z+V(r,y) +... + Viry) 
où Un = U202? + U117y + Uo2Y?, Us, y) = U307° + U21T?y + U12T7Y? + Uozÿ*, etc. 
Ona uw = +U(x,y) + Ua(x',y") +... + Un(x',y'), c'est-à-dire d’après (1) : 
+ Ur[At+ Ro, y)+ "+R, (a, y), py+Sa(x, y)+ + (x, y)] 
++ UnlAr+Ro(e, y)+ + Rat, y), Hy+Sa(x, y)+---+S(x, y)] 


et d'autre part 
Au = Àz + AU (x, y) + AU3(x, y) +: + AUN(x, y). 


Calculons les coefficients dans les U; pour qu'il n’y ait plus de terme de degré 2 dans 
u' — }u. Pour u/, les termes de degré 2 sont localisés dans R2 et U2, et pour u, ils 
sont dans U. 


2 


dans uw”, le terme en x? est r202° + u20X?x?, donc on doit avoir 


2 
T20 + U20À° = ÀU20 


le terme en zy dans w’ est r117y + ua Auxy, d'où 


Par + Un AU = Au 
de même, en égalisant les termes en y? dans w/ et Àu, on obtient 
2 
To2 + Uo2U = HU02 


La première égalité s'écrit (À — \?)u20 = r20 et détermine u20 à condition que À # X?. 
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Les deux autres égalités déterminent u11 et uo2 à condition que À £ Au et nu # p?. 
Les termes en x° dans w/ sont les suivants : 

dans À3 : [rs0x°] : dans U : [u2o(2Ax r207?)| ; dans U3 : [us0 x] 
On doit donc avoir légalité r30 + 2r2ou20 À + U30À° = Àu3o. Puisque u20 est connu, cela 
détermine u30 si À Z X°. 
Dans l'équation qui exprime l'égalité des termes en æ°?y dans uw’ et Au, tous les termes 
sont connus, sauf u21 qui apparaît avec le coefficient À?y; dans w” et avec le coefficient 
À dans Au; on peut donc en tirer la valeur de w21 pourvu que À £ \?y. Les conditions 
pour trouver les coefficients de v sont analogues, mais les rôles de À et y; sont échangés. 
Nous n'avons pas vérifié que l'application w:(x,y)- (u,v) est bien un changement de co- 
ordonnées au voisinage de l’origine, c'est-à-dire ici une bijection dérivable dont la bijection 
réciproque est dérivable : c'est une conséquence du théorème des fonctions implicites. 


En continuant ainsi par degré, on peut calculer de proche en proche les coefficients 
de u et de v qui annulent les termes de degré inférieur ou égal à N : la condition 
est qu'il n'existe entre les valeurs propres aucune relation de la forme 


1= X'uÿ où p= y , aveci>0,j>0eti+j>2 


On dit que ce sont les conditions de « non résonance ». En particulier, À et y doivent 


être non nuls, différents de +1 et l’on doit avoir Àu # 1 (sinon À — \ li). 

En négligeant les termes de degré supérieurs à N, on obtient dans les nouvelles 

coordonnées les formules uw’ = Au , v = pv. 
Si les conditions de non résonance sont vérifiées, il est même possible par cette méthode 
de trouver, au voisinage de l’origine, un changement de coordonnées qui supprime tous 
les termes de degré supérieur à 1, mais le changement de coordonnées n’est plus poly- 


nomial : dans ces nouvelles coordonnées, la transformation s'exprime alors exactement 
par les formules linéaires uw’ = Au, v' = pv. 


Exemple. Prenons la transformation F(x,y)=(27+2?-2y+7",(1/3)y+27y-y? +27) 4 
La matrice jacobienne à l’origine est Jr — É | . On voit facilement que les va- 


leurs propres 2 et 1/3 satisfont aux conditions de non résonance. Le changement de 
coordonnées polynomial qui supprime les termes de degré inférieurs ou égaux à 3 
est donné par 


u(z,y) = 5 — (1/2)x° — (3/4)æy + (1/3)x° — (15/8)x°y + (63/64)xy° + (27/53)y° 
U(x, y) = y — 6xy — (9/2)y? + 25x°?y + 72xy° + (81/8)y° 
et l’on a G{u,v) = (2u,v/3)+termes de degré au moins 4. Noter que, dans le change- 
ment de coordonnées, on ne peut pas trouver de formule explicite pour exprimer x 
et y au moyen de u,v. 
Pour visualiser la transformation, nous avons représenté les itérés de quelques points 
proches de l’origine en reliant leurs positions successives par un segment; dans la 


CHAPITRE 12 - FONCTIONS DE PLUSIEURS VARIABLES - 391 


figure 1, les coordonnées sont x,y; dans la figure 2, les coordonnées sont u, v. 


0,005 
0,004 
0,003 
0,002 
0.001 


D 
F 01 02 03 % 


figure 1 


v 
0,005 


0,004 
0,003 
0,002 
0,001 


| 37 
01 02 03% 


figure 2 


L'étude générale d’une telle itération linéaire est expliquée dans l'exemple 2 page 


187 : comparer la figure 2 ci-dessus à 


celles qui y sont présentées. 


a Exercices emmmmmmmx 


@ 1. Une recherche d'extremum. Cherchons le maximum de la fonction f(x,y) = 2° — 3xy? 


dans le disque unité D = { (x,y) € R? | x? + y? 


1}. 


a) Trouver les points critiques de f. Y a-t-il extremum local en ces points ? 


b) Montrer que le maximum M et le minimum m de f sur D sont atteints en des 


points du cercle x? + y? = 1. Étudier la fonction g(t) = f(cost,sint) pour trouver 


ces points et les valeurs M et m. 


cd Montrer que la fonction f est harmonique. 


2. En utilisant l'expression du laplacien en coordonnées polaires (page 372), vérifier que 
si k est un entier quelconque, les fonctions r* cos k0 et r* sin k0 sont harmoniques. 


@ 3. Calcul d'une fonction d'offre. Supposons que le coût de production à court terme d’une 
entreprise est c(q,a) — gd —q + (5—4a)q + 2a°?, où qg mesure le niveau de production 


et a l'impact des charges fixes. 


a) Le coût à long terme d’une production q est la valeur minimum de c(q,a) par rap- 


port à a. En calculant _. montrer que le coût à long terme est c{(q) = q°—3q?+5q. 
(sA 


b) Soit p le prix de vente unitaire du bien fabriqué. Le profit d’une production q 
est donc II = pq — cl(g). Montrer que le profit positif D s'obtient pour 


g=1+4/(p-2)/3 (vérifier que pour cette valeur, on a bien PL< < 0). 
q 


c) Le coût à long terme d’une unité de production est cl(q)/q. Pour quelle valeur de q 
ce coût est-il minimum ? Montrer que le minimum vaut 2,75. En déduire que l’entre- 


si p < 2,75 


prise peut adopter le plan de production suivant : e={1 14 VG—2)73 ie 
Dessiner la courbe qui représente la variation de q en fonction de p lorsque p est 


entre 0 et 14. 
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4. 


ou 


Une stratégie de production. Supposons que la fonction de production d’une entreprise 
est de la forme q = «TK, où T est la quantité de travail, K le capital mobilisé 
pour la production et «,f5 des nombres positifs tels que a +8 = 1, a étant un 
coefficient normatif fixe. On note w le salaire versé par unité de travail, r le taux 
de rémunération d’un capital immobilisé et f le montant des frais de gestion. Le 
coût de production est donc c = wT'+rK + f. 

L'entreprise assure une production Q donnée et veut minimiser son coût : comment 
doit-elle répartir quantité de travail et capital mobilisé ? 


a) Calculer les vecteurs Grad,(T, K) et Grad.(T, K). Montrer que le minimum de 
c lorsque q(T', K) — Q est obtenu lorsque T/K = ar/Bw. 


b)En déduire que les valeurs cherchées sont K —(Q/a)(Bw/ar)* et T — 
(Q/a)(ar/Bw)f. 
of 


. Une fonction f(x,y) peut avoir une dérivée partielle identiquement nulle et 


dépendre néanmoins de y. Par exemple, définissons la fonction sur le domaine 
: x? sizæ>0ety>0 
D =R?\{(x,0) | x > 0} en posant f(x, y) = 4 -x? si x > 0 et y <0. 


0 si x < 0 


Ô à : : 7 
a) Montrer que AL (at) vaut 0 si a <0, 2a si a et b sont strictement positifs, et —2a 
T 


FR, b)—f(0, b) 
h 


dans le cas a > 0, b < 0. Montrer que si b 0, tend vers O0 quand 


h tend vers O (avec un signe quelconque) : en déduire que l’on a 21 (0,8) =0 et 
TL 
of 


que la fonction 5x est continue en tout point de D. 
TZ 


b) Montrer que _ —0 en tout point de D, mais que les valeurs f(1,y) dépendent de y. 


. Quelle est l'équation de la tangente à la courbe d’équation x(x°? + y?) + y° = 8 au 


point (0,2)? Comment varie y quand x parcourt un petit intervalle autour de 0 ? 


. On s'intéresse à la distance de l’origine à la courbe (C') d’équation x(x°+y?)+y°=8. 


Posons f(x, y) = x(x? + y?) + y° — 8. 

a) Soit M un point de (C') où la distance d(M) à l'origine présente un extremum 
local. Montrer qu'il en va de même du carré de la distance à l’origine et que les 
coordonnées de M vérifient les équations f(x, y) = 0 et y[x? + y? — 3xy] = 0. 

b) Pour tout point M = (x,y) sur la courbe et tel que M Z (0,2), on pose y = tx. 
Montrer que si d(M) a un extremum local, alors t est l’un des trois nombres 0, 
th =(1/2)(3+ V5) ou t = (1/2)(3-V5). Pour tout point de la courbe, calculer x et 
y au moyen de +. En déduire, par comparaison de trois distances, que le minimum 
de d(M) ne peut être obtenu qu’au point À = (2(1+45-+H5) 1/8 : 241(1+H5-+H5) 13). 
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c] Dans la question précédente, on a obtenu un paramétrage de la courbe de la forme 
x(t) = 2u(t),y(t) = 2tu(t), où u(t) =(1+#2 +8) V5, En étudiant les variations de 
d(t) = x(t)? + y(t)? au voisinage de t — #1, montrer que cette fonction y présente 
effectivement un minimum; en déduire que la distance de l’origine à (C') est la 
distance O A. Montrer aussi qu’au point (2,0), la distance d(M) a un minimum local. 


d) Faire dessiner la courbe (C') par un ordinateur. 


@ 8. Fonction de Bessel. La fonction de Bessel d'indice O est Jo(x) — - ol cos(x sin 0) dO. 


a) Montrer que J5 est une fonction paire. Calculer J6(0) et J6(0). 
b) Exprimer Ji(x) et J{(x) au moyen d’une intégrale et montrer que J{ (x) + Jo(x) = 
L'[ (cos 0)? cos(x sin 0) d6. 


TT J0 


c) En faisant une intégration par parties dans l'expression de Ji(x), montrer que Jo 


satisfait l'équation différentielle (bo) : y” + y + y = 0 (équation de Bessel). 
d) Vérifier au moyen d’un ordinateur que le graphe de J a l'allure ci-dessous : 


y 


> 
T 


@ 9. Harmoniques cylindriques. En coordonnées cylindriques, les fonctions harmoniques 
PF LOF, A0, dr 
= 72). 
02? . Or? r ôr : r? 00? D'APAESNE 
Une fonction dont les valeurs présentent une symétrie de révolution par rapport à 
Di LOL =) 


02? Or? r ôr 


sont les solutions de l'équation 


l'axe Oz s'écrit f(r,z) et, dans ce cas, l'équation devient 


Cherchons une solution de la forme f(r,z) = eX=u(r). 
a) Montrer que la fonction f est harmonique à la condition que u soit solution de 
l'équation différentielle u” + Lu + k2u = 0. 
r 
b) En utilisant l'exercice 8, montrer que pour toute constante k, les fonctions 
e*kZ Ji(kr) sont harmoniques. 


10. Petites oscillations d'une chaîne pesante. Considérons une chaîne pesante 
homogène de longueur { suspendue à son extrémité supérieure À; L 
on note © la position d'équilibre de l'extrémité libre, on choisit un A 
axe vertical Oz dirigé vers le haut et l’on repère le petit déplacement 
latéral d’un point de la chaîne sur un axe horizontal Ox. Les coor- 
données de À sont donc x = 0,2 = {. Si p est la densité linéaire de la 
chaîne, la tension en un point d’ordonnée z est pgz ; en notant x(2,t) O x 
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le déplacement latéral à l'instant t du point de hauteur 2 et en laissant la chaîne 
osciller librement, l'équation du mouvement est 


dx Ô | 2e | 
1 0 
(1) er oz Pg? ce 


a) Par le changement de variable y — 2,4/2/g, montrer que cette équation devient 
dx dx, 10x| _ 

2 2 0 

* Oy" y dy 


b) Cherchons une solution de la forme x = u(y) coswt. Montrer que la fonction u 


doit satisfaire l'équation différentielle uw” + 1, + w?u = 0. 
y 


d'En utilisant l'exercice 8, montrer que pour tout nombre a, la fonction 
x(2,t) = ao (20273) coswt est solution de (1). Décrire le mouvement de 


l'extrémité libre : que représente a ? 
d) En exprimant que le point À est fixe, montrer que l’on a J (20 L/ 9) = 0. En 


déduire que les pulsations w possibles sont données par w; = (1/ 2)a;:/g/£, où 
@ < 2 <--- sont les solutions positives de l'équation J5(x) = 0 (voir page 577). 
e) Notons x;(2,t) la solution correspondant à w=w;. Montrer que dans ce mouvement, 
les points d’ordonnées 2; = {(a;/a;)?, où j —1,2,...,i—1, sont immobiles. 
Si l'on se donne le profil de la chaîne à l'instant initial, le mouvement est une 
superposition de mouvements x;(z,t). 


. Étude géométrique d'un ellipsoïde. On considère l’ellipsoïde E d’équation f(x,y,2) —k, 
où f(x, y, 2) = x? + 5y? + 62? — Axy — 8yz + 2x2 — 2x + 82 + 6, k étant un nombre 
strictement positif. 

a) Calculer les dérivées partielles de f et trouver le point critique de f. Le centre 
de Æ est le point C' où f atteint son minimum : en déduire que C' = (2,0, —1). 
b) On prend C comme nouvelle origine pour les coordonnées. 
( Montrer que l'équation de Æ dans les nouvelles coordonnées X,Y,7Z est 
g(X,Y,2) = k, avec g(X,Y,Z) = f(X+2,Y,7-1). 
li) Vérifier que les extrémités des axes de l’ellipsoïde sont les points M de E où 
la distance MC présente un maximum local (exercice 3 du chapitre 7). Posons 
w(X,Y,Z) = X?+Y?+7? = MC?. En déduire qu’en ces points, les vecteurs 
Grad, (M) et Grady (M ) sont colinéaires. Calculer ces deux vecteurs gradients en 
un point M quelconque de coordonnées (X, Y, Z). 
li) Chercher les extrémités en procédant comme dans l'exemple 3 page 219 : écrire 


X 
la matrice symétrique S telle que g(X,Y,Z) =[X Y Z]S | Y | et calculer son 
Z 


polynôme caractéristique ; montrer que les valeurs propres sont à peu près 10,012, 
0,051 et 1,935 et en déduire des vecteurs propres approchés (rappelons que les 
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vecteurs propres de S sont deux à deux orthogonaux : voir page 217); déterminer 
enfin, pour chaque vecteur propre V, les deux nombres +t tel que g(tV) = k et 
calculer les coordonnées (x,y,z) des sommets de l’ellipsoïde. 


@ 12. Partie principale d'une quantité implicite. Supposons que des quantités x et y voisines 

de 0 sont reliées par la relation f(x, y) = y* — 21%? — Ax$y + à$ — x = 0. 

a) Calculer les dérivées partielles de f en (0,0) et montrer que le théorème des 
fonctions implicites ne s'applique pas en ce point. 

b) Pour x donné voisin de 0, l'équation f(x,y)=0 peut avoir plusieurs solutions y(x). 
Pour trouver le comportement de ces solutions au voisinage de l’origine, cherchons 
une approximation y(x) = ax*, où à # 0. Calculer g(x) = f(x,ax*) et montrer 
que dans g(x), les puissances de x ont pour exposant 4a,2a +3,a+5,6 et 7. 

c) On cherche a et à pour que la plus petite puissance de x disparaisse. Il faut pour 
cela que le minimum 7 des exposants soit obtenu au moins dans deux termes 
différents et qu'après regroupement, le coefficient de x” soit nul. En dessinant les 
graphes de 4a,2a +3,a+5,6 et 7 en fonction de «& (ce sont des droites), montrer 
qu’on doit prendre «= 3/2. Vérifier qu'on a alors g(x) = 2°[(a?—1)? —4ax!/? — x] 
et qu’il faut donc choisir a = +1. 


d) Dessiner le graphe de la fonction y = x°/? au voisinage de l’origine. La figure 
ci-contre montre la courbe (C') d’équation f(x,y) =0 pour 


: : à . y 
Ix| < 0,05 : expliquez pourquoi ce dessin est compatible ui (C) 
avec le résultat obtenu en {e) et pourquoi la courbe n'est 
= 
pas représentée par le graphe d’une fonction de x. O 002 00 x 


e) Pour distinguer les deux branches de la courbe quand x est petit, cherchons une 
meilleure approximation sous la forme y(x) =x%/2(1+0bx"). En posant { =x, mon- 
trer que f(x, y(x)) =t/?h(t), avec h(t) = 4b 2418 + 40460 + D86 — 44 ape 28 2, 
Justifier comme précédemment que l’on a 8 = 1/4 et b = +1. En déduire que 
les branches de la courbe sont approchées au voisinage de l’origine par les fonc- 
tions y1(x) = 2/2? + x7/4 et y9(x) — 29/2 — x7/4, Ces expressions s'appellent les 
développements de Puiseux de f au voisinage de l’origine. 


On peut chercher un développement de Puiseux en un point où le théorème des 
fonctions implicites ne s'applique pas, c'est-à-dire où les deux dérivées partielles de 
la fonction sont nulles. 
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Chapitre 13 


Intégrales multiples 


1. Notion d'intégrale multiple et méthode de calcul 


Dans ce chapitre, les coordonnées cartésiennes x,y,z des points de l’espace ou du 
plan sont prises dans un repère orthonormé. 
Soit f(x,y) une fonction continue de deux variables définie sur un rectangle 


<æz<b,c<y<d. En prenant une primitive en x, puis en y, on obtient une 


fonction F telle que a (2) = f. Pour x fixé, si l’on intègre f(x,y) par rapport 
T 


à y entre c et d, on obtient une quantité 


D f'renae [ 2 (2) (ev dy = 2 (0) - (ao 


Intégrons maintenant {(x) entre a et b : 


(1) fre a= [2 (x d) de [2e c)dz=F(bd)—F(a,d)—(F(b,c)—F(a,c)) 


2 
Intervertissons l’ordre des intégrations. Puisque f — —. d’après le théorème de 
TOY 


Schwarz, l'intégrale en x de a à b est 


D= ['revare [2 (2) (née = tn - (a, 


a OT | Oy 0) 
et il vient 
d d d 
(2) | J(u) dy= | DE (b.0) dy | DE (au dy FD -F(b0—(F(ad)—F(a.0) 


Les nombres en {1} et (2) sont égaux. C’est donc que l’on a 


[fev avar = ff" rev de a | 
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autrement dit on peut pratiquer la double intégration dans l’ordre qu’on veut. La 
quantité ainsi obtenue s'appelle l'intégrale double de f sur le rectangle R={(x,y)|a< 
x <b,c< y<d} et se note IL f(x, y) dxdy. 

Plus généralement, considérons un domaine D du plan, borné et limité par des 
courbes, comme sur les figures ci-contre : 
pour + fixé, y varie entre u(x) et u(x) 
pour y fixé, x varie entre a(y) et b(y). 


Alors les deux ordres d'intégration possibles conduisent 
encore au même résultat : si a et b sont les bornes 
extrêmes en x et si c et d sont les bornes extrêmes en 
y, on a l'égalité 


[ (Lise y à) ue [ (Lis De ) . 


Définition 
La quantité ci-dessus s'appelle l'intégrale double de la fonction f sur le domaine 
D et se note IL f(x, y) dxdy. 


Une intégrale double se calcule par deux intégrations successives, dans l'ordre qu'on veut. 


Exemple. Calculons l'intégrale double 1 = | Le xy dxdy, où D est formé des points 
à coordonnées positives dans le disque de rayon r centré à l’origine. On a donc 
D = {(x,y)|x > 0,y > 0, et x? + y? <r?}. Pour x fixé entre 0 et r, la coordonnée 
y varie entre 0 et V7? — x?, donc 


T rx? FLY VrT € 
1= | | xy dy | dx 
0 | 0 y 


Si f(æ,y,2) est une fonction de trois variables définie sur un domaine V de l’espace 
limité par des surfaces, on définit de même l'intégrale triple Î I] IL f(x, y, 2) dxdydz : 


on la calcule en intégrant successivement par rapport à chaque variable, dans l’ordre 
qu'on veut. 


Propriétés des intégrales multiples 


a) Si f est à valeurs positives ou nulles, son intégrale est positive ou nulle. 
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b)Si f et g sont définies sur un même domaine D, l'intégrale de f + g sur D est 
la somme des intégrales de f et de g sur D. 


c| L'intégrale de f sur la réunion de deux domaines disjoints est la somme des 
intégrales de f sur ces domaines. 


d\ Si R est le rectangle a < x <b, c < y < d, alors pour un produit d’une fonction 


de x par une fonction de y, on a JL u(x)v(y) dxdy — ( fut) dx) CL u(y) dy). 


1.1 Aires et volumes 


Calcul d'une aire plane 


Soit D un domaine plan limité par des courbes, par exemple constitué des points (x,y) 


tel que a£x<b et u(x) <y<vu(x). Pour x fixé entre a et b,ona dy=v(x)-u(x), 


(x 
donc f, dxdy = d [u(x)—u(x)] dx = ['uta) dx — l u(x) dx. 
L'intégrale L u(x) dx est l’aire algébrique comprise entre l’axe © y = v(x) 
des abscisses et la courbe d’équation y = u(x) : sur la figure, 
c'est la quantité [u]1—[ul2, où le crochet désigne l’aire absolue. [ul 


De même, l'intégrale de v est l’aire {[v] sous cette courbe, donc la 
b b 
différence | v(x) dr | u(x) dx =[v]-[ul1+l[ul2 est l'aire de D. 


L'aire d'un domaine plan D est Î[ dxdy. 
D 


Cette intégrale double s’interprète comme la somme des éléments d’aire infinitésimaux dxdy. 


Calcul d'une aire dans l'espace 


Soit S la surface d’équation z = f(x,y) définie sur un domaine D du plan xOy. 


Soient m=(x,y) un point intérieur à D et M=(x,y, f(x,y)) le point de S qui se projette 
en m. Donnons-nous de petits accroissements ÿx, 
dy, posons x’ = x + ôx, y! = y + Üy et considé- 
rons les points de la surface : P=(x’,y, f(x',y)), 
Q=(æv", fav) et R= (x',y', f(a",y)). Sup- 
posons que f possède des dérivées partielles 
continues, donc S$ a un plan tangent en tout 


point. Si Ôx et Ôy sont très petits, l’aire ds du 
morceau de surface compris entre M, P,Q,R est 
proche de l'aire du parallélogramme construit sur les vecteurs MP, MQ (c'est ainsi que 
nous avons déjà raisonné pour calculer la longueur d’une courbe paramétrée, page 312). 


L’aire du parallélogramme est la norme du produit vectoriel MPA MQ (page 225). 
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En ne gardant que les infiniments petits de l’ordre de ôx et dy, on a 


MP = [6x , 0, f(x+ôx,y)-f(x,v)] = Le. ms _ 


MP A MQ L Ôx0y , ai ox0y , Ge y 


Ôy 


et pour l'élément d’aire sur la surface, il vient l’approximation 


2 2 
ôs=|| MP AMQ | = Gui) + (22) Ÿ (2) 


En sommant tous ces éléments d’aire, on obtient la formule 


she des = f] + (Len) + (Aer) dry 


Cas d'une surface paramétrée. Supposons plus généralement que la surface 
S' est l’ensemble des points 


Mu, v) = (x(u,v),y(u,v), z(u,v)) 


où u et v sont des paramètres réels, les fonctions æ(u,v),y(u,v),z(u,v) ayant des 
dérivées continues. 

OM (de dy œ) à OM (dr dy 9z 
Ou Ou’ Ou’ du Ov Ov’ Ov’ Ov 
Si en chaque point M € S, ces vecteurs sont linéairement indépendants, on dit 


Les vecteurs 


) sont tangents à S. 


que S' est régulière, ce qu’on suppose désormais. 
oM 
), 2 ( 


Le produit vectoriel H= ou A om est un vecteur non nul et orthogonal à $. Le vec- 
U 
l 


Aœol H (u, v) s'appelle le vecteur normal unitaire au point M{u,v). 


— L'expression da — || H (u,v)|| dudv s'appelle l'élément d'aire de la surface. 


Les vecteurs u, VU 


om u,v) forment une base du plan tangent à S en M{u,v). 
u 


teur N(u,v)= 


C'est l'aire du parallélogramme t tangent à à S au point M{u,v) et de cotés les « vecteurs 


oM oM 
Ou dès FL 


tangents infiniment petits » 


L'aire de S est fda= [ [| LH (u, v)|| dudv, où A est le domaine parcouru par (u,v). 


Une surface d’équation z — er (x,y) est naturellement paramétrée en posant r=u, y=v, 
= OM _ 0f\ oM _ 0f\ 5 -9, _i 
z = f(u,v). On a alors Du ( 0, di k Ou (oi. Dv , H 


et l’on retrouve la formule donnée précédemment pour l'aire. 
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Calculs de volumes 


Une interprétation de l'intégrale double. Soit f(x,y) une fonction à valeurs 
positives et soit S la surface d'équation z= f(x,y), où (x,y) parcourt un domaine D 
du plan. Pour x fixé, les . (to, y, z) situés sous la surface forment une portion 
de plan vertical limité Le co < y <d et OL z< f(xo,y). L’aire de cette portion de 


plan est donc s(x0) Sn f (to, y) dy. 


Épaississons la tranche en considérant les points (x,y,2) si- 
tués sous la surface et tels que %0 < x < 0 + Ôx, où Ôx est 
une « quantité infiniment petite » (voir page 286). 

En négligeant les produits de deux infiniment petits, le vo- 
lume de cette tranche épaisse est le produit s(x9) 6x de sa 
surface par son épaisseur. En sommant sur x6, on obtient le 
volume V situé sous la surface. 


Le volume compris entre un domaine plan D et la surface d'équation z2= f(x,y) est 


Î[ f(x, y) dxdy. 


Une interprétation de l'intégrale triple. Soit V un domaine de l’espace com- 
pris entre deux surfaces d’équation 2 = u(x,y) et z = v(x,y), où u(x,y) < v(x,y), 
les coordonnées x et y parcourant un domaine D du plan. On a ainsi V — 
{(x,y,2) | (x, y) € D et u(x,y) < z < u(x,y)}. Si (x,y) est un point fixé, alors 


ie dz = v(x, y) — u(x,y), donc 


u(æ,y) 


Î dudydz = ][ [u(x, y)—u(x, y)] dudy = ]f ve, dudy— f] uv) dxdy 


L'intégrale double IL v(x,y)dxdy est le volume compris entre le plan xOy et la 
surface z = u(x,y), l'intégrale double Î ul u(x, y) dxdy est celui compris entre le plan 
xOy et la surface z — u(x,y), donc le volume de V est ÎL, dxdydz. 


Le volume d'une portion V d'espace est 1] dxdydz. 
V 


L'intégrale s’interprète comme la somme des éléments de volume infinitésimaux dxdydz. 


Exemple. Calculons le volume de l’ellipsoïde (plein) de ré- 
volution d’axe Oz, de rayon r dans le plan xOy et de hauteur 


2h. Son équation est x? + y? + (2) = r?. Notons E l’ellip- 


soïde. Pour calculer son volume V = IL. dxdydz, intégrons 
d’abord par rapport à x et y, c’est-à-dire pour z fixé. À une 
hauteur z comprise entre —h et h, la section horizontale est 


CHAPITRE 13 - INTÉGRALES MULTIPLES - 401 


2 
un disque D(2) limité par le cercle d’équation x? +? =r? (i — Z) ; l’aire du disque 


D(2) est s(z) = mr? (1 — 2) et V = [' (JL, drdu) dz, donc 


h fr 2 3 
V = Î s(z) dz = me | 1-2 | de = nr? (2h-2# | = lp 
= à he 3h? 3 


En particulier, pour h=r, on trouve que le volume d’une boule de rayon r est (4/3)rr. 


Centre de gravité, moment d'inertie 

Choisissons un point © de l’espace. Si l’on place en des points A:,...,A, des masses 
mi,..., Mn, le centre de gravité du système ainsi formé est le point G& (indépendant 
du choix de l’origine ©) défini par 


où M = ÿ};_,m; est la masse totale du système. En prenant des axes passant par 
O, les points À; ont des coordonnées (x;,;,z;) et les coordonnées de G sont 


5 5 Mit: , >. Ma ; 5 ma) 
i=1 i=1 i=l 


On définit de même le centre de gravité d'un solide S : la masse d’un élément de 
volume infinitésimal placé en (x,y,2) est dm = p(x,y, 2) dxdydz, où p est la masse 
volumique en chaque point du solide. 

— La masse totale du solide est M = I. p(x, y, 2) dxdydz. 


Les coordonnées du centre de gravité sont 


[frère 55 flhven. x flo 


Le moment d'inertie du solide par rapport à un axe À est ÎTE (du)?p drdydz, où du 
est la distance du point M = (x,y,z2) à la droite À et p la masse volumique en ce 
point. Nous avons aussi défini page 227 la matrice d'inertie relativement à un point. 


Exemple 1. Reprenons l’ellipsoïde de l'exemple précédent et considérons une ca- 
lotte supérieure, pleine, de hauteur a, où 0 < a < h. Cette calotte étant située entre 
les hauteurs h — a et h, son volume est 


h 2 h3 — h— 3 
v= | mie) ae nr [a- ÈS 
h-a h 3h 


Supposons que la calotte (C') est un solide homogène de masse volumique p. Le 
centre de gravité G de la calotte se trouve sur l’axe de symétrie Oz : les coordonnées 
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sm — À . 
de G sont (0,0,Z), où Z = . Î[L = odxdydz. Il vient 


h 2 k 3 
vZ= | ci £a nr ] (5) 
hk-a h h-a h 


h? …: _ 4 4 _ 12 4 
_— (A a) h (h—a) pe 1—k 1—k 
2 Ah? 
d’où l'on tire la valeur de Z. Si a=h=r, notre calotte pleine est la demi-boule supé- 
rieure de rayon r centrée à l’origine : le centre de gravité est à la hauteur Z =(3/8)r. 


Exemple 2. Considérons une plaque rectangulaire homogène, de longueur 2a, de 
largeur 2b et de masse M. Quel est le moment d'inertie de la plaque par rapport à 
l'une de ses diagonales ? 


Prenons l’origine du repère au centre du rectangle et l’axe des YA 
abscisses dans le sens de la longueur. Le domaine R est donc P 

formé des points (x,y) tels que —-a<x<a et —b<y< b. 7 R A 
La diagonale de pente positive a pour équation y = (b/a)x, ou 


Sn. 


encore bx—ay—0. La distance d’un point P—(x,y) à cette droite 

|bx — sl 
a? 

Le moment d’ hote de la plaque par rapport à une diagonale est donc par définition 


. 0 ca HE du (JL, (ay) du) dx 


b . 
JL @-on -7 . = (br ay) | = Se [Cor +ab)* (bx at} = à [(x+a)?—(x—a)"] 


est d(x . La masse surfacique, rapport de la masse à l'aire, est p= M /Aab. 
YU) q PP 


[tete -(e-atar = 2 + ED got 


. M bo 4 M 8a°b® _ 2M ab 
d'où 1 = 8a — — : 
4ab(a? + b?) 3a Aab(a? +b?) 3 3 a? + 


1.2 Changement de variables 


Soit D un domaine de l’espace dont les points (x,y,2) sont paramétrés par trois 
variables (u,v,w) : précisément, supposons qu'il y a une application 4 : À —+ D de 
la forme (u,v,w)+ (æ(u,v,w), y(u,v,w),z(u,v,w)) ayant les propriétés suivantes : 
— p: À — D est une bijection, 

les fonctions x, y et z ont des dérivées partielles continues par rapport à u,v,w, 
en tout point (u,v,w) € À, la matrice jacobienne J, est inversible (page 367). 

La formule du changement de variable pour l'intégrale ordinaire (page 320) se 
généralise aux intégrales multiples, sous la forme : 


(+) [IL f(x, y,z )drdydz = [][ 5e Q(u, v, w) )) [det J, | dudvdw 
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Expliquons pourquoi intervient le déterminant de la matrice jacobienne. Considérons 
dans À un petit parallélépipède P de sommet U = (u,v,w), à côtés parallèles aux axes 
et de longueurs ôu,ôv,ôw. Les côtés de P sont donc dirigés par les vecteurs (du,0,0), 
(0,6v,0), (0,0, 8w). Posons M = @(U). Par l’approximation affine de 4 en U, un point 
quelconque U” de P se transforme en M' = M +J,X, où X est la colonne des coor- 
données de UU/. En appelant Ji,J2,J3 les colonnes de la matrice jacobienne, l’image 
de P est le parallélépipède IT de sommet M construit sur les vecteurs 


2,0 [® |=cun (0) [or] = Gen | 20) | 9 | = Guns 


Puisque le volume de IT est la valeur absolue du déterminant de ces vecteurs, il vient 
volume de II = [det(J1, Ja, J3)|éudvôv = [det(J,,(U)) [éudvorv 
En considérant que P et IT sont des « éléments de volume infiniment petits », l'intégrale 


triple F 1) 1 f(x, y, 2) dxdydz s'obtient en sommant toutes les quantités 
D 


FM) x volume de II = F(e(U))[det (7, (U))|ousvou . 


Intégrale double en coordonnées polaires. Rappelons que si M =(x,y) est 
un point du plan différent de l’origine ©, les coordonnées polaires de M sont les 


nombres r = OM = \/x? +%° et 0 = Ox, OM. On a donc les formules 
æ=Trcos0 ,; y—=rsmO, où r>0et 0 <0<27. 


Le changement de variable est w(r,0) = (rcos4,rsin0) et le déterminant de la matrice 


cos 0 —rsin 0 


ing rcospl—"(cos0)+r(sin6) =r. 


jacobienne (page 368) est det J, = | 


Si D est un domaine plan et si À est l’ensemble des coordonnées (r,0) des points 
de D, la formule du changement de variables s'écrit 


JL fm dndy =] 676050, rsin 0) r drdo 


Exemple. Sur la sphère de rayon R centrée à l’origine, dé- 
coupons la calotte supérieure de hauteur h < R. Son plan de 
base est à la distance d= R—h de l’origine, le cercle horizontal 
inférieur a pour rayon p = VR? — d, donc la calotte est la sur- 
face d’équation z = 4/R? — x? — y?, où x? + y? < p?. Calculons 
l'aire À de cette calotte en utilisant la formule page 400. Les 


se ; : - Of —T 
zs DE 2 _ 
dérivées partielles de la fonction f(x,y) = 4/R? — x? — y? sont 3x FEES : 
2 
of _ = ( of ) of\ R? 
Où Fr , donc 1 + 9x + dy Fees En appelant D le 


disque du plan xOy défini par x? + y? < p?, il vient 
2 2 
A= f] 14H02) 4% dody = R |] 1 — dvdy 
D Ox 0y D YR2— x? — y? 
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En coordonnées polaires, le disque D est défini par r < p et 0 < 0 < 27. On a donc 


27 P P 
l r 
a=R| | ———r dr d0 = 2 | —— dr 
0 (| \/R2 — r? | 0 VR2-—7r? 


Par le changement de variable u — VR? — r?, on a du — ee d’où 
= 


AZ MR |-VR 7) 7 = 2RR(R- VAE D) = 2m R(R - d) = 2rRh 


En particulier, pour À — R, on trouve que l'hémisphère a pour surface 27 R? : l’aire 
d’une sphère de rayon R est donc 4rR?. 


Intégrale en coordonnées cylindriques. Si M —(x,y,2) est un point de l’es- 
pace non situé sur l’axe Oz, les coordonnées cylindriques de M sont 

(r,0,z), où r et 0 sont les coordonnées polaires du point m—(x,y) ? M 
projection de M sur le plan xOy. 


Si W est l’ensemble des coordonnées cylindriques d’un domaine V À 
de l’espace, la formule du changement de variables s'écrit O Fe 
z 
Î[]. f(x, y, 2) dxdydz = 11]. fr cos 4, r sin 0, z) r drdôdz 
V w 
Remarque 


Pour le changement de variables des coordonnées sphériques, le déterminant de la 
matrice jacobienne est r? cos (page 368). 


1.3 Intégrales doubles généralisées 


On doit parfois considérer l'intégrale d’une fonction f(x,y) sur un domaine non 
borné, comme par exemple un quart de plan D = {(x,y) € R? |x > a et y > b}. 


Posons Du —{(x,y)|a<r<u,b<y<v}.Siles intégrales Z(u,v) = /f. . f(x, y) dxdy 
ont une limite quand « et v tendent vers +00, cette limite est l'intégrale généralisée 
1 f(x, y) dxdy. 

Voici des conditions qui assurent l'existence de l'intégrale généralisée. 

Pour que IL f(x, y) dxdy existe, il suffit que pour tout x > a, l'intégrale généralisée 
p(x) = [7 |f(x, y)| dy existe et que l'intégrale généralisée 'u w(x) dx existe. 


Soit f une fonction définie sur le quart de plan D ={(x,y)|x >0 et y >0}. Passons 
en coordonnées polaires en posant F(r,0) = f(rcos0,rsin0) et notons 


DR le secteur formé des points de D tels que r < R. Si elle existe, l'in- D 
tégrale généralisée JT — / la f(x, y) dxdy est la an quand À tend vers N 
+oo des intégrales 1r = 1. #( æ,y) dxdy = ul ou rE(r, éjär) de. O R % 
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k 


Critère d'existence. S'il existe un nombre a >2 et une constante k tels que z,y)|< 
q F 


ed 
alors I existe. 


En effet, on a alors [rF(r,0)| < k 


+oo 
= eta-1>1, donc : rF(r,0) dr existe (page 325). 


Exemples. Le domaine D est le quart de plan x 20, y > 0. 
cos y dx dy 


Si «à > 1, l'intégrale généralisée l I] ———— existe. 
8 8 D (x? rs y? rs 1)° 
En passant aux coordonnées polaires, on a en effet [f(æ, y)| = = < _ et 


l’on a 2a > 2 si a > 1. 
-Onal=/fe (ay?) dxdy = 7%. 


En effet, ! = lim /r, où 


R— +00 


r/2rR _- R _. 1 R? .: 
IR= [ Le rdrd9 =] re ‘dr= S[-5e l =fF(-e R?) 


- Puisque e-(2" +9) = ee w, on a aussi, en utilisant la propriété (d) page 399, 
q Prop pag 


Dao +00 3 +00 ; ; +00 5 
1- | e + | dxdy= fl e * an fl e Ÿ 7) —J", avec 1- | e * dx. 
D 0 0 0 


Il vient donc de. dx = Vr, Par le changement de variable x = t/2, on en 
0 2 8 


déduit L'err dt = SV 27 et la valeur de l'intégrale de Gauss (page 333) 


+00 
| e t/2qt = V2T 


Application aux probabilités 


Variable aléatoire à valeurs dans R? 
Soient À et Ÿ des variables aléatoires définies sur le même ensemble d'événements. 


On note (X,Y) la variable aléatoire dont la valeur sur tout événement w est le 
couple (x,y) = (X(w),Y(w)). 


La variable aléatoire (X,Y) prend ses valeurs dans 
l'ensemble R? des couples de nombres réels. 


La fonction de répartition de la variable aléatoire V = (X,Y) est définie par 
H(x,y) = P[(X < x) et (Y <y)], pour tout (x,y) € R°. 


Il s'ensuit que les variables X et Y sont indépendantes si et seulement si la fonction 
de répartition de (X,Y) est le produit Fx(x)Fy (y), où Fx et Fy sont les fonctions 
de répartition de X et Y (définition page 335). 
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Pour tout couple (x,y) de nombres réels, posons D; 4 = ]-00,x] x ]—co,y]. S'il existe 


une fonction h de deux variables, continue et positive, telle que pour tout (x, y), 


H(x,y) = Î. h(t,u) dtdu, 


2 
alors À s'appelle la densité de (X,Y). Dans ce cas, on a Ces 


= h et 
Ox0y de 


Pia <X<bje (ee y<d)]= I! h(t,u) dtdu, où R est le rectangle Ja, b] X ]c, d]. 
R 


Espérance et variance pour des variables indépendantes 


Soient X et Ÿ deux variables aléatoires possédant une espérance et une variance. 
Notons V(X) la variance de X et rappelons que la covariance de (X,Y) est 
Cov(X,Y) = E(XY) — E(X)E(Y) (page 381). 


Proposition. Si X et Y sont indépendantes, alors on a E(XY) = E(X)E(Y), 
V(X+Y) = V(X) + V(Y) ef Cov(X, Y) = 0. 

Justification. Montrons la formule pour l'espérance du produit XY dans le cas particulier 
où l’ensemble des événements est fini. Notons %:1,%2,...,%, et Y1,Y2,...,Yn les Valeurs pos- 
sibles de X et de Y et w; ; l'événement (X = x; et Y =y;). Par définition, l'espérance de XY 
est E(XY)= 5, ,2:y; P(u,;). On a P(u:,;) = P(X =x:;)P(Y =y;) car X et Y sont indépen- 
dantes, d’où E(XY) = D x; P(X = 5) (5, v;P(Y = »)) = E(X)E(Y). Par définition 
de la covariance, on en déduit Cov(X,Y) = 0. La variance de Z = X+Y est l'espérance de 
22 [E(2)} = X2-[E(X)|" +Y2-[E(Y)]" +2(XY — E(X)E(Y)). On a ainsi la formule 
générale V(X+Y) = V(X)+V(Y)+2Cov(X,Y), d'où le résultat. ul 


Estimation empirique de la variance 

Soit X une variable aléatoire et (X1, X2,...,X,) une suite de réalisations indépen- 

dantes suivant la loi de X. On sait que la moyenne Y — es +:-..+X,) est une 
nm 


estimation de l'espérance de X : en effet, l'espérance est une fonction linéaire (pages 
70 et 329) et toutes les variables X; ont pour espérance E(X:), donc E(Y) = E(X:). 


Pour estimer la variance E(X?) — [E(X }” de X, considérons donc 
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Puisqu’on a E(X?) = E(X?), il vient E (2 (XP +... + x?)) = =nE(X?) = EX). 


D'autre part, Y? = ml (Ex? HI, . d’où 


E(Y?) = NE ECAP 4 2 ph E(X;)E(X;) (indépendance des X;) 


= 2 E(X?) sr [E(X)], car E(X;) = E(X:) 


Il 

Lans 
5 
+ 
& 
Li 


Finalement, E(5)=E(X?) L = E(Xÿ) [EX] = 2 (EG?) — PRAIDE donc 


n 


E(v) = =, où v est la variance de X:. 
nm 


La variable 


© est une estimation empirique de la variance de X. 


Loi d'une somme 
Soient X et Y deux variables aléatoires indépendantes de densité f et g. Selon la 
définition donnée page 335, la “ de . de X +YŸ est définie par la 


formule H(s)= P(X+Y<s )= ff. - g(y) dxdy, ou encore 
T+Y< . 


H()= Î f(x) P(Y < 5-2) de = , (of away)a 


Faisons le changement de variable t=y+x dans la dernière intégrale : on a 
IAEOL ER g(t— x) dt, d'où H(s D (ue f(x )g(t — x) dt) dx et en in- 
tervertissant l’ordre des intégrations, il vient 


a= [” = feat — à de) à 


OO 


Par définition, la fonction A(t )= f(æ)g(t — x) dx est donc la densité de X +Y. 


Proposition. Si X et Y sont deux variables aléatoires indépendantes ayant pour densité 
f et g, alors X +Y a pour densité h(t) = ru fG)g(t — x) dr. 


Lorsqu'on fait des mesures, les résultats sont souvent distribués autour de leur 
moyenne selon une loi normale. Des erreurs d’origine diverses pouvant s'ajouter, on 
a besoin de savoir comment se comporte leur somme. Si les erreurs sont indépen- 
dantes, nous avons vu que la variance de la somme est la somme des variances, 
mais voici un résultat plus précis. 
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Somme de deux variables normales indépendantes. Soient X et Y des 
variables aléatoires indépendantes suivant les lois normales .W(m1,01) et .W(m2,02). Alors 


X +Y suit la loi normale .W(m,o), où m = ma + mo et o = V/o? + 03. 


Démonstration. En remplaçant X et Y par X — m1 et Ÿ — m2, on se ramène au cas 
ma = M2 = 0. Par définition de la loi normale (page 334) et d’après la proposition, la densité 
de X +Ÿ est dans ce cas 


+oo 2 a. 2 
il z (t—x) 
h(t) = d 
() 270102 1 Fe ( da) E ( 20? ) d 


En développant le carré dans la seconde exponentielle, la fonction sous le signe intégrale s'écrit 


É x? 0? ) (4) ( 2 ) (- (xo— toi/a)° ) ( Fo, =) 
ex ex exp | <= | =exp|—-—— | ex = —— }ex 
? ( a) : ( 20703 L de d 292 sd 20? 03 P 20702 
2 (0? — 0? xo—toi/o 2 æo—toi/o 
exp ( ce 5 2) exp (-! 1/0) .) = EXP (5) ex (- Eee 
20° 03 20? 0? 20 20? 0? 


2 +00 t 
On a donc h(t) = 1 exp ( 1 -) J Exp (Ça) dx. Par le changement 


270102 20 — 0 20? 0? 


(u—a)? 


ie 
de variable u = xa, cette dernière intégrale s'écrit — _ xp (- ) du, où a est une 


constante, donc est égale à 1, 270102 par définition de la loi Fa répartition normale. On 
2 
obtient ainsi l'égalité h(t) = 1 exp nn) = 


oV2r 20°? 


Produit de convolution 
Définition 
Soient f et g des fonctions. Si l'intégrale généralisée h(t ei. f(x g(t — x) dx 


existe, la fonction h s'appelle le produit de convolution des fonctions ; et g et se 
note f *xg 


— Si le produit de convolution de f et g existe, alors f x g = g* f. 


Par le changement de variable u = t — x, il vient en effet 
+0co 


= [T oa(t-0) de [Heat due 7 gta) (tu) du (gx) 


— 00 


Si a et a sont des nombres et si les produits de convolution fi *g et f2*xg 
existent, alors (a1f1 + a2f2) * g = a( fi * g) + a2(f2 * g). 

Si l’une des fonctions f ou g vaut 0 en dehors d’un segment [a,b], alors le produit 
de convolution f * g existe. 


En effet, si l’on a f(x) = 0 pour x hors de {a,b], l'intégrale généralisée est l'intégrale 


b 
ordinaire Î f(æ)g(t-x) dx. 
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— De nombreuses mesures physiques conduisent à l'analyse d’un signal causal : c'est 
une fonction u telle que u(x)=0 pour tout x <0. Si u et v sont des signaux causaux, 


t 
leur produit de convolution u * v existe et l’on a (u x v)(t) = Î u(æ)v(t — x) dx. 


On a en effet u(x) = 0 si x <0 et u(t—x) = 0 si x >t, donc u(x)v(t—-x) = 0 si x 
est en dehors du segment [0, t]. 
Pour trois fonctions f,g,h, on a l'égalité f x (gx h) =(f x g) *h si tous les produits 
de convolution existent. 


Produit de convolution en théorie du signal 


Un analyseur linéaire est un système électronique de traitement des signaux fonc- 
tionnant sur le mode 


signal d'entrée u + réponse u *x f 


La fonction f est caractéristique du dispositif. En entrée, on envoie le plus souvent 
un signal causal u dont la variable est le temps. 


Réponse à une impulsion. Prenons comme signal d’entrée une fonction uy cons- 
tante sur le segment [a,a + h] et nulle hors de cet intervalle; pour que le signal 
d'entrée soit toujours de moyenne égale à 1, fixons 1/h comme valeur de u, sur 
[a,a + h]. On a donc 

a+h 


+00 a+h 
(un * f)(t) = :l un(x)f(t-x) dx = f un(æ)f(t-x) dx = 1/f f(t-x) dx 


O0 a 


a , p(Rh) ath : 
L'intégrale de droite est 7 où p(h) =} f(t-x) dx. Si h tend vers 0, la ré- 


a+h 
ponse . | f(t— x) dx à l'instant t{ tend donc vers w/(0) = f(t— a) : physiquement, 
, Ja 

cela signifie que si le signal d'entrée est une impulsion unité à l'instant a, la réponse 
est la fonction f,(t) = f(t— a), c’est-à-dire la fonction f affectée d’un retard a (à 
l'instant { — a, sa valeur est f,(a) — f(0)). 
En particulier, si l'entrée est l'impulsion unité à l'instant 0, la réponse est f : on dit 
que f est la réponse impulsionnelle du système. 

La réponse à une impulsion v(x) à l'instant x est le signal {+ v(x)f,(t). Puisque 

+00 
(ux f)(t) = { u(x) fx(t) dx, le produit de convolution v*+ f apparaît comme « la somme 


sur æ» des réponses impulsionnelles {+ f,(t) pondérées par la valeur du signal à 


l'instant x. 


Exemple. Supposons que la réponse impulsionnelle est définie par f(x) =1 si 
1<zx<2et f(x) —0 sinon. Pour le signal d'entrée défini par u(t) = 1 si 0,6 <t<1,2 
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et u(t) = 0 sinon, la réponse est 


0 si t < 1,6 t—1,6 si1,6<t< 2,2 
(u x f)(t) = 4 0,6 si 2,2 <t< 2,6 3,2—t si 2,6 <t< 3,2 
0 si t > 3,2 


te 
la réponse impulsionnelle f 


1 2 


1 2 3 
signal d'entrée v réponse  * f 
Ces signaux d'entrée présentent des discontinuités, maïs les réponses sont continues 
sur R : le produit de convolution a un effet régularisant. 
D'après la proposition du paragraphe précédent, la fonction u* f, par exemple, est aussi 
la densité de probabilité de la somme X +Y de deux variables aléatoires de densité 
uniforme sur les intervalles [0,6, 1.2] et [1,2]. 


ES Exercices 


1. Aire d'un secteur plan. On considère un secteur plan délimité par deux segments de 
droites OA et OB issus de l’origine et par une courbe joi- 
gnant À et B d’équation OM = r = f(8) en coordonnées 


polaires. Soit #; l'angle Ox, OA et 6 l'angle Ox, OB, où 
l’on suppose 0 < 01 < 02 < 27. 


0 
Montrer que l'aire du secteur est È D ‘ [f (6)|” dô. 
2 J@ 


2. Volume d'un tore plein. Faisons tourner un disque D de rayon p autour d’un axe situé 
dans le plan de D et situé à une distance 
a > p : le volume de l’espace ainsi obtenu 
s'appelle un tore plein (l’intérieur d’une 
chambre à air en est une bonne image). 
On veut calculer le volume V ainsi ob- 
tenu. Appelons U le centre du disque, 
Oz l'axe de révolution, l'origine © étant 
le projeté orthogonal de U sur l'axe; 
l'axe Ox est dirigé par OÙ et Oy est 
orthogonal au plan du disque. Le point 
U a donc pour coordonnées cylindriques 
(r = a,0 = 0,z= 0). 
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È 


@ 5. 


a) Montrer que le disque est formé des points dont les coordonnées vérifient 4 = 0 et 
2 +{(a—r)?< p?. Notons À l’ensemble des couples (r,z) vérifiant cette inégalité. 


Z 


b} Montrer que V — 27 Î. r dr dz. En déduire V = 27 [ (LE 
u(z) = a — Vp?-2? et v(z) = a + /p?—21. 


€) Montrer que V = 2ar°p?. 


'rar) dz, où 


. Aire d'une surface torique. Reprenons les notations de l'exercice précédent et appelons 


S la surface du tore. 


a) Pour tout point M du plan xOz, notons « l'angle Ox,OM. Montrer que le 
bord du disque D est formé des points tels que x — a + pcosu et z = psinu. 
En déduire que S est formée des points M(u,0) de coordonnées cartésiennes 
æ=(a+pcosu)cosd, y—=(a+pcosu)sin®, z= psinu, où 0Lu<L27r et 0 LOL27. 

0M 4% 0M 


du 00 
p(a + p cos u) du dO. En déduire que l’aire du tore est 4r?pa. 


b) Calculer les vecteurs et montrer que l'élément d’aire est 


. Soient X et Y des variables aléatoires indépendantes et de loi uniforme sur [0,1]. 


On pose M =max{X,Y } et m—min{X,Y }. Soit { un nombre compris entre 0 et 1. 

a) Montrer que l’on a P(M <t) —t? et que l'espérance de M est 2/3. Montrer que 
P(m<t)=t(2-t) et que l'espérance de m est 1/3 (comparer à l'exercice 10 page 340). 

b) Pour tous nombres u et v entre 0 et 1, notons f(u,v) la probabilité de l’événement 
[(M <u) et (m<v)] . Montrer que f(u,v)=v(2u—v) et que la densité de (M,m) est 2. 

c) On pose D = M — m. Montrer que P(D <t) =2/[ du dv, où D={(u,v)|0<u< 
letu—-t<v<u}.En déduire que P(D <t)—t(2-t). Quelle est l'espérance de D? 

d) On pose Q = m/M. Montrer que P(Q <t) — 2 /], du dv, où A={{u,v)|0<u< 
let v<tu}. En déduire que P(Q <t)=t. 


On fait un essai d'engrais sur 
onze parcelles de terrain : sur engrais À engrais B 
les cinq premières, on met l’en- 
grais À et sur les six dernières, 
l’engrais B. Le tableau ci-contre 
donne les rendements observés. 
On veut savoir à quel risque on peut affirmer que B a un meilleur rendement que 
A. Pour cela, considérons les rendements respectifs comme des variables aléatoires 
RA et RB et faisons l'hypothèse que ces variables sont indépendantes et qu’ils sui- 
vent une loi normale. Notons M1 et Mg les rendements moyens de À et de B (ce 
sont aussi des variables aléatoires). 


a) Calculer l'espérance empirique mA et la variance empirique v4 de R1. Calculer 
de même l'espérance empirique mg et la variance empirique v£ de Rp. (On 
trouve ma = 20,8, va = (5/4) x 32,56, mp — 23 et vs — (6/5) x 22,66.) 
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b) Montrer que la variance empirique de MA est aà — EL A= _ et que la va- 


riance empirique de Mg est a7, — + En déduire _ l’écart-type empirique de 
D = MA — Mg est o — Fe + — Quelle est l'espérance empirique de D? 

) Montrer que la probabilité pour que D < mA—mp + bo vaut à peu près ®(b), où 
® est la fonction de Gauss (page 335). Calculer b pour que ma—mps +bo =0. En 
déduire qu’on peut accepter l'hypothèse «l'engrais B a un meiïlleur rendement 
que l’engrais À » au risque 27% environ. 


. Produit de convolution et approximation en moyenne. Si f est une fonction continue 


dont la valeur absolue |f(x)| a une intégrale généralisée de —c à +00, on pose 
fil = [© |f(x)| dx. Supposons que f et g sont de telles fonctions. Alors le produit 
de convolution (|f|*|g[)(t) = |f(æ)l |g(t-x)| dr existe quel que soit t, résultat 


que nous admettons. 


a) Montrer que [7 [TT |f(æ)||g(t-x)| dx dt < LS x)||g(u)| dx du 
(faire le changement de variable u = t—x). 


b) Remarquer que |f x g(t)| < [T |f(x)g(t-x)| dx. En déduire l'inégalité 
If x all < [F1 lg: 


c) On dit que des fonctions f, tendent en moyenne vers f si ||f—f,|| tend vers 0 
quand n tend vers l'infini. En utilisant (b), montrer que si f, tend en moyenne 
vers f, alors f, * g tend en moyenne vers f *g. 
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Chapitre 14 


Champ de vecteurs, 
formes différentielles 


1. Champ de vecteurs 


Repérons les points dans le plan ou l’espace au moyen du repère orthonormé (O:i,5,k). 
Un champ de vecteurs est la donnée, en tout point M d’une région de l’espace (ou 


du plan xOy), d'un vecteur E(M) de l’espace (ou du plan) dépendant du point M. 


Définitions 

Si U est un domaine de l’espace, un champ de vecteurs sur U est une fonction 
E(x,y,2) = P(x,y, z)i +Q(x,y, 2) j +R(x,y,2)k, où P,Q,R sont des fonctions 
à valeurs réelles définies dans U. 


Si D est un domaine plan, une fonction E(x,y) — P(x,y) i+Q(x,y)j est un 
champ de vecteurs sur D. 


Nous supposons dans la suite que les fonctions coordonnées P,Q,R ont des dérivées 
secondes continues. 


Exemples 


Un champ de vitesses. Dans un fluide en mouvement, chaque particule possède, 
à un instant donné, un vecteur vitesse v qui dépend de sa 


position : si la particule est au point de coordonnées (x,y,z),  : 
sa vitesse est u(r,y,z) — D +4 +2. RS 
La figure ci-contre montre le champ des vitesses dans un | : . n e 3 
mouvement circulaire plan autour de l’origine : en tout point \ . à | : : V b 
M = (x,y), le vecteur v(x,y) est orthogonal à OM, donc de NN" 

NS 


la forme v(x,y) = w(x,y)(—y,x). Le nombre w(x,y) est la 
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vitesse angulaire car |v|| = [w|4/(—y)? + x? = rlwl, où r = OM est la distance au 
centre. Sur la figure, nous avons choisi w constant. 


Le champ de gravitation. Une masse mo en un point À de l’espace exerce sur 
toute autre masse m placée en un point M distant de r, une force d'attraction 


9) = - PR ù 


positif G est la constante d'attraction. La fonction g est un champ de vecteurs. Les 


u, où ü est le vecteur unitaire dans la direction AM. Le nombre 


vecteurs g(M) étant toujours dirigés vers le point À, on dit que le champ est central. 
Le champ électrique. De même, une charge électrique go en A exerce sur toute 
autre charge placée en un point M distant de r, une force E(M) — a, où € 
r? 


est une constante, positive ou négative, dépendant des unités choisies. 


Lignes de champ 


Définition 
Si E est un champ de vecteurs dans un domaine D du plan, une ligne de champ 
est une courbe paramétrée régulière tracée dans D, tangente en tout point M au 


vecteur E(M) et parcourue dans le sens du champ. 


En .. M(t)=(x(#), y(t)) et E=Pi+Qÿj, cela signifie que pour tout t, les vecteurs 
(x/(8),y/(#)) et (P[x(t),y(0)], Q[x(t), y(t)]) sont colinéaires et de même sens. 


Exemple. Le champ E(x, y) =xi-yj est représenté ci-contre : 
sur l’axe des abscisses (y — 0), le champ est horizontal, sur l’axe 6 ’ / 
des ordonnées (= 0), le champ est vertical et aux autres points 7” 7 


| 

} 

} 
s au np + NN Re 
M = (x,y), la pente du champ est _ = —t, où t est la pente = 
——— RSR k|4 AA AT 
de OM. Lans thrr er 
Une ligne de champ (x(t),y(t)) doit vérifier + \ L ' 49%% 


be | = x(t)y(#) + (ty) = L (ay) 


L'équation d’une ligne de champ est donc xy = c, où c est une constante. 
Si c = 0, on obtient les quatre demi-axes de coordonnées. 


— Pour cZ£0, les lignes de champ sont des hyperboles ayant les axes pour asymptotes. 
1.1 Champ de gradient 


Soit V(x,y,z) une fonction de trois variables, à valeurs réelles et ayant des dérivées 


continues. 
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Définition 
Le champ de vecteurs Grady(x,y,z) = _ 
TL 


gradient de V. La fonction p = —V est un potentiel du champ (il est défini à 


We ea j+ _ k s'appelle le champ de 
l'addition près d’une constante). 


Exemple. Soit E un champ de vecteurs central dont l'intensité 7 


en tout point M est proportionnelle à r étant la distance de 


1 
pe" 
M au centre. En appelant À le centre, on a donc 


E(M) = 


C — 
—U 

e 

où r est la distance AM, u le vecteur unitaire dans la direction AM et c une 
C 


constante. Montrons que E est un champ de gradient, de potentiel p(x, y, z) = <. 
= 


Choisissons l’origine des coordonnées en A. Si M = (x,y,2), alors r? = x? + y? + 2?, 


ù = Lam = L(x,y, 2) et E(x, y, 2) = 2 à Foi +. On a a = D et en posant 
1 Or ct à OV __ y Ov 
53 œ) IS meme D et =, 


V = —p, il vient D - 1 


E , donc 
r 


E(x,y,2) — Grady (x, y, 2). 


Propriétés du gradient 
 Gradyiw = Grady + Gradw. 


— Gradyw (M) = V(M) Gradw (M) + W(M) Grady (M). 


Expression du gradient en coordonnées cylindriques. Si (r,0,2) sont les 
coordonnées cylindriques d’un point M, introduisons, comme page 368, les vecteurs 
orthogonaux unitaires ü = cos Qi+sin 0j et ui =-—snmYi+cos0j, de sorte qu'on a 


OM=rü+zk. D'après le calcul fait au chapitre 12, l'expression du gradient de V est 


AA OV >, 19V — , OVE 
Grady — k 

FEV Gr La 00 La 

Lignes de champ d'un champ de gradient 
Soit E—Grady un champ de gradient dans le plan. En tout point M, la ligne de niveau 
de V passant par M est orthogonale au vecteur Grady (M) (page 370). Puisque le 


champ en M est Grady (M), cette ligne de niveau est orthogonale à la ligne de champ. 
Les lignes de niveau de V (ou de p, ce qui revient au même) s'appellent des 
équipotentielles et l’on a le résultat suivant. 


Les lignes de champ de E sont les courbes orthogonales aux équipotentielles. 
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Exemple Reprenons le champ E(x,y) = x i —yj (dernier 
exemple du précédent paragraphe). Si l’on pose V{x, y) = 
5 (x°— y"), alors D“? du y, donc Grady =(x,—) 


E(x,y) : ainsi le champ Æ est un champ de gradient, 


de potentiel —V. Les équipotentielles ont pour équation 


2? — y = k, où k est une constante. 


Pour k—0, on obtient comme équipotentielles les droites 


d'équation y = x et y — —x, bissectrices des axes. 
Si k 0, l’équipotentielle d’équation x? — y? — k est une hyperbole ayant pour 
asymptotes les bissectrices des axes. 
En tout point M—(a,b) du plan, il passe l’équipotentielle H d’équation x?—y?=a?—b? 
et la ligne de champ L d’équation xy = ab. D'après le résultat précédent, H et L 
sont orthogonales au point M. 


1.2 Rotationnel 
Supposons que le champ de vecteur E(x,y, 2) = P(x,y,2)4+Q(x,y, 2) j+R(x,y,2)k 


est un champ de gradient, de potentiel —V. Alors on a (P,Q,R)=— (2. a œ) et 


oR _0Q _ à a 2 faV\_ SV __dV _)p 
0y OZ 0y \ Oz 02 \ 0y 0y0Zz  020y 


car on peut dériver dans l’ordre qu'on veut. De même, 


oP Ro (8v) 0 (OV) 0 « 0Q _9P __ à (oV 2 (0 
Oz 0x 0z2\0x/ 0x \0z 0x y x \ ôy 0y \ dx | 


Définition 
Pour tout champ de vecteurs E = Pi+Q j+Rk, le champ de vecteurs 
Rot(E) = oR _ 0Q i+(2P-0R);+ 0Q _2P\; 
0y OZ OZ 0x Ox 0y 
s'appelle le rotationnel de E. 


énonçons ce que montre le calcul qu’on vient de faire. 


Tout champ de gradient a un rotationnel nul. 


Procédé de calcul du rotationnel. Définissons le « vecteur-opération » 


V = 2. _. 2 , appelé nabla. 
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Pour tout champ de vecteur E de composantes [P,Q,R], on obtient les composantes 
du rotationnel de Æ en calculant le « produit vectoriel » (page 223) 


2 oR_0Q 

. P Oy OZ 

0P _OR 

VAE=])S IA | 
y : OZ  Ox 

© Q _aP 

02 0x  Ôy 


Pour un champ de vecteurs E = P(x,y)i+Q(x,y)j dans le plan, on a simplement 
Roi(E)= (28 _0P | 
OT  0y 


car la fonction À est nulle ainsi que les dérivées de P et de Q par rapport à 2. 


Le rotationnel d'un champ de vecteur dans le plan xOy est orthogonal à ce plan. 


Exemple 1. Dans un mouvement plan circulaire uniforme de centre l’origine, le 


champ des vitesses E(x, y) — —wyi+wxj a un rotationnel constant : 


Roi(E) = (2 en 


}E= 20 


Exemple 2. Soit D le domaine du plan formé des points 


différents de l’origine. Le champ de vecteurs sur D défini par M 
E(M)= + 35, où r est la distance OM, a un rotationnel nul. O 
FT F 
En effet, en posant P — = et Q — +, on a 
LA dés 
8Q __1,,0€r ") _ 1 3) 0r _ 1 _2æx _ 1 _ 2? 
= x(—2 
Ox r? Tæ Ox 2 + LA F la r? r3 FT r? r 
2 
et de même OP =+ + 2. Il vient 
0y r? r* 


0Q _oP __2 _22 +24 __ 2 _ 9r° 
0x dy r? r4 r? r4 


Cependant, nous montrerons page 424 que Æ n’est pas un champ de gradient : avoir 
un rotationnel nul ne suffit pas toujours pour être un champ de gradient. 


Formulaire 

— Rot(Grady ) = 0 

- Rot(E+F)=Rot(E)+Rot(F) 

Si f est une fonction, Rot(f E) = Gradr A E + f Rot ( E À: 
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En coordonnées cylindriques, posons E= E, u +Eo +E.k, où les vecteurs ü et 
ui sont définis page 368. L'expression du rotationnel est 


Rot(&) = (10 Pu+(-te)m+ (0 + À Le) & 


Tr. 00 Oz O2 or 


Recherche d'un potentiel 


_ + 2 _ 
Exemple. Considérons le champ E = #4 —_ | j défini sur le demi-plan D 
y y 
formé des points (x,y) tels que y >0. Les composantes du champ sont P(x,y) = _ 


2 — , — = 

et Q(x,y) = © + de sorte que = . = = et donc Rot( E) = 0. 
Cherchons un potentiel —V, c'est-à-dire une fonction telle que 

OV _ —2x dti 

ee, ee een is 

Ôx y Oy y y 

En intégrant en x, la première condition donne 


vide —- 0. 


où u est fonction de la seule variable y (voir page 369). Dérivons par rapport à y : 


2 2 
D +u(gj= Ver + L 
y Oy y y 
donc w/ (y) = n et u(y)=— L +k, où k est une constante. Ainsi la fonction V{x,y)= 
y y 
2 —— 
= ue a pour dérivées partielles Ve pet 0 = Q, autrement dit E = Grady. 
y.  2y 0x Oy 


Proposition. Soit E un champ de vecteurs défini dans un domaine D et tel que 

ED 

a) Supposons que pour tous points À et B de D, le parallélépipède (ou le rectangle) de diago- 
nale AB à côtés parallèles aux axes est inclus dans D. Si (a,b,c) est un point de D, alors 
on a E = Grady, où V(x,y,2) = [P(ty,2) dt+ [Q(at,2)dt+ [| R(a,6,1) dt. 

b) Supposons que pour tout point M € D, le segment OM qui joint M à l'origine est 
inclus dans D. Alors on a EË = Grady, où 


1 1 1 
V(x,y,2) = 7 P(tx,ty,tz) dt + v[ Q{tzx, ty,tz) dt + : | Q{tzx, ty, tz) dt. 
0 0 0 


L'espace tout entier, ou un demi-plan de frontière parallèle à un axe de coordonnée, 
possède la propriété (a); un disque ou un demi-plan contenant l’origine possède la 
propriété [b]; l'espace ou le plan privé d’un point ne possède aucune de ces propriétés. 


Démonstration. Prenons le cas d’un domaine plan et appelons P.Q les composantes de E. 
Supposons la première condition vérifiée et raisonnons comme dans l'exemple ci-dessus : on 
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veut de — P, donc V(x,y) = L P(t, y) dt + u(y), où u(y) = V(a,y). 


a z,y) -] & oe (t, y) dt + u’(y) (dérivation sous le signe intégrale) 


[5 20 u'(y) ro 24 


= Q(x,y) — Q(a, y) + u'(y) 


Puisqu'on doit avoir SE (a y) = Q(x, y), il s'ensuit w/(y) = Q{(a,y) et u(y) — 7 Q(a,t) dt, 


ce qu'il fallait nie 


1 1 
Supposons satisfaite la condition de {b) et posons V(x,y) = z] P(ix, ty) dt+y Q(tx, ty) dt. 


Ces intégrales ont un sens, car si (æ,y) est un point de D, alors pour tout nombre t entre 
0 et 1, (tx, ty) est aussi dans D, par hypothèse. En dérivant sous le signe intégrale, on a 


n= | Pie, ty) ae [#2 tP (4, tnai+u f EE (tr, ty) dt 
0 


1 
= P(tx, ty) a+e [ 1 19P( (tx, ty) a+u f 2 rue (tx, ty) dt ce 0P 
0 


nn 


1 1 
= | P(tx,ty) dt + | tU(t) dt 
0 0 


1 
où U(t)= z0P ES ty)+y Le (tx, ty) = _ P(tx,ty). Il vient en intégrant par parties Fi tU(t) dt= 
y ? 0 
1 
[EP(Ex,ty)| pe P(tx,ty) dt=P(x,y) -f P(tx, ty) dt, et donc op. (x,y)=P(x,y). On montre 
0 Jo 0 Ox 


de même l'égalité D (1) = Q(x, y). = 
y 


Divergence d'un champ de vecteurs 


Définition 
La divergence du champ de vecteurs E = Pi+Q j+Rk est la fonction div E = 


Formulaire 
- div(E+F) = divE +divF 
 div[Rot(E }] =0 
2°Q 
mr 2 0yÿ? 
Si f est une fonction, div(fE) = (f) div E + Grad/ E 
— div(EA F) = [Roi(E)].F-E.[Roi(F)] 
En coordonnées cylindriques, avec la notation E = E, ü +Eo +E,k, on a 
0E, 1 dE ÔE, 


— E 
divE = T 
_ Dr LE 20 * 8z 


even R 
— div(Grady) est le laplacien AV = Er + 2 de V. 
7A 
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Une application en hydrodynamique 
Dans un fluide en mouvement, chaque particule a des coordonnées d'espace (x,y, 2) 
et un vecteur vitesse u à +v j +wk. Notons u la masse volumique (qui dans le cas 
d’un gaz, par exemple, n’est pas nécessairement constante). 

Considérons au point (x,y,z2), un petit élément de volume 6x0y0z à côtés parallèles 

aux axes de coordonnées. 

Pendant un petit intervalle de temps Ôf, la masse de matière 

entrant dans ce volume par une face parallèle à yOz est 

A, y, zJu(æ, y, 2) 6n0y6z 68, 

et la quantité sortant par la face opposée est (au premier ordre) 

O(uu) 
Ôx 


En raisonnant de même pour les autres faces, le bilan de masse est 
O(uu) … O(uv) | O(uw)\. 
ôm ( ce + dy + 52 0x0 yoz Ôt 
La masse w0xôyôz de l'élément de volume varie de m pendant le temps ôf, donc 
ôm O(uu) | O(uv) | O(uw) eo 
St ( ee + ôy + 5: OxOyÔz = St 0x0y02 
Puisque cette masse ne varie pas, en passant aux dérivées, on obtient 
o(uu) " (uv) _ o(uw) L on 
0x 0y OZ ot 


Dans le cas d’une masse gazeuse thermiquement isolée, le paramètre naturel de contrôle 


u(x+ôx, y, z)u(x+ôx, y, 2) 6x0 yoz dt — (DE y, 2) + (æ,y, 2) üe| 0ydz Ôt 


= 0 (équation de continuité) 


est la pression p : si po et 0 sont les valeurs de la pression et de la masse volumique à 
un certain instant, alors d’après la loi thermodynamique des gaz, on a p/po = (4/uo)”, 
où 7 est une constante dépendant de la nature du gaz (pour l'air atmosphérique, 7 
vaut environ 1,4). 


Supposons le fluide incompressible. Alors y est constant et l'équation de continuité 


s'écrit = + L + ou =0. En introduisant le champ des vitesses V=ui+vj+wr, il vient 
œ y F2 


div Y =0 
Supposons enfin que les mouvements dans le fluide ne présentent aucun tourbillon : 
il n’y a aucune ligne de courant fermée, ce qui se traduit par Rot(Y ).= D. Si l'es: 
pace occupé est un domaine convenable (voir ir page 420), on sait que le champ des 
vitesses possède un potentiel p : on a Ÿ = -Grad ad,. D'après l'équation de continuité, 
le laplacien de p est Ap = div(Grad, )=—div YŸ =0, d'où 


= 0. 


Dans ces conditions, le champ des vitesses dérive donc d’un potentiel harmonique. 
Pour avoir l'équation des lignes de courant, il faut trouver une fonction p harmonique 
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dans le domaine D et satisfaisant des conditions au bord de D ou à l'infini, comme 
par exemple Grad, tangent au bord et p nul à l'infini (voir page 372 et l'exercice 2). 
Nous verrons page 433 que le mouvement du fluide est alors parfaitement déterminé. 


1.3 Intégrale curviligne 


Soit E = Pi+Q j+Rk un champ de vecteurs et soit C': M(t) = (x(t),y(t),2()) une 
courbe paramétrée régulière tracée dans le domaine du champ. 


Interprétons le vecteur E(M) comme une force appliquée au point M. Le travail de la 
force le long d’un petit déplacement ôs sur C, du point M(t) 
au point M(t+ôt), est le produit scalaire E(M): 68T', où T 
est le vecteur tangent unitaire à C en M (seule compte la 


composante de la force dans la direction du déplacement). En 
paramétrant la courbe par l’abscisse curviligne s (page 313), 


le travail de E le long de C' est donc 
ee 
W = | E(M(s)) : T(s) ds, où L est la longueur de C. 


dt, donc Tds = on dt. Si le paramètre { varie de a à b, 


On sait que ds — | “| 


il vient W — LE HO)E sOM dt, ou encore 


= fre v.200)e"(0 +0 (e0 2020) 0 RCE 700 200) 0] 


Définition 
L'intégrale 
b 
LP, (D, 210)2/(0+0 (00,90, 20) (0+R (a v0, 20) D] dt 
s'appelle la circulation ou l'intégrale du champ le long de C' et se note L.Pdx+Qdy+Rdz. 
On dit que c’est une intégrale curviligne. 


Nous venons de montrer que la circulation du champ le long de C' ne dépend pas de 
la façon dont on paramètre la courbe, à condition de garder le même sens de parcours. 
Mais si l’on change le sens de parcours, l'intégrale curviligne change de signe. 


Calcul d'une intégrale curviligne. Pour calculer W — L Pdx+Qdy+Rdz, 


- on remplace x,y,z par x(t), y(t), z(t) dans les fonctions P,Q,R, 
- on remplace dx, dy, dz par les différentielles x'(t)dt, y'(t)dt, z'(t)dt, 


- et l'intégrale curviligne est donnée par l'expression (+). 
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Intégrale curviligne et potentiel 


supposons E = Grady, donc (æ Ci œ) = (P,Q,R). On a alors 


0x” Oy” Oz 
OV dx oV dy OV dz 
dV = dt dt dt — Pd d Rd 
0x dt Ta dt Lu dt au Le 


donc 


dt 
= V(x(b), y), z(b)) — V(x(a), ya), z(a)) = V(B) — V(4) 


où À est l’origine de la courbe et B son extrémité. 


b 
| Pdx+Qdy+Rdz = | LV (x(t),y(#), z(6) dt 
C a 


Théorème. 5i E—Grady, alors .Pax+Qdy+Rdz=V(B)-V(4) pour toute courbe 
d'origine À et d'extrémité B. 


Si un champ possède un potentiel p, sa circulation le long d’une courbe est la 
différence de potentiel p(A) — p(B) entre l’origine À et l'extrémité B : l'intégrale 
curviligne ne dépend pas de la forme de la courbe, mais seulement de la position 
des extrémités. Cette propriété est caractéristique d’un champ de gradient. 


Conséquences. Si un champ possède un potentiel, 


i son intégrale le long de toute courbe fermée est nulle; 


ü) aucune ligne de champ n'est fermée. 


Dans la direction du vecteur Grady, la fonction V est strictement croissante (page 365), 
donc le potentiel est décroissant. Puisqu’une ligne du champ E = Grady est en tout 
point tangente au gradient de V, le potentiel décrofît strictement quand on parcourt cette 
ligne dans le sens du champ : si À est l’origine d’une ligne de champ et B l'extrémité, 
alors p(A) — p(B) est un nombre strictement positif, donc non nul; il s'ensuit que les 
points À et B sont différents, et la ligne de champ n’est pas fermée. 


Exemple. Reprenons le champ Æ de composantes P — = 


» #« | + 


Q= +, étudié dans l’exemple 2 page 419. Calculons la circulation 
= 


de E le long du cercle C de rayon a centré à l’origine. 
En paramétrant C par x(t)=acost,y=asint, il vient Pdx+Qdy= 


Eee 2 (a?sin?t-+a?cos?t)dt=dt, d'où L.Pdx+Qdy=2r. 


à À 


AAA se ele 1 € 4 


p pH Ale + x x x 


a e ele > 


r? a? 


La circulation de E le long de la courbe fermée C n’est pas nulle, donc E n'est pas 
un champ de gradient. 

Bien que son rotationnel soit nul, ce champ est défini dans le plan privé de l'origine, 
un domaine qui n’a aucune des propriétés énoncées dans la proposition page 420. 
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Exemple du champ de ee Pour un champ de gravitation E(M) = 
-Eü, où r est la distance OM et üu = OM, le potentiel est p(M) = É (exemple 
page 417). | 

Pour toute courbe d’origine À et d'extrémité B, le travail du champ le long de cette 


1 1 
courbe est K (1 à) 


Dans le cas de la gravité terrestre, pour de faibles variations d’altitude, on considère que 


le champ est constant : E(M)=—mgu, où g est la «constante » de gravitation terrestre et 


m la masse au point M ; on a alors E(x, y, 2)= mg (£ ; - : 2) =-—mgGrad,=-Gradgr 
et le potentiel est mgr : le travail du champ de pesanteur le long d’une courbe est alors 


simplement le produit du poids mg par la différence d'altitude des extrémités. 


La loi de conservation de l'énergie. Soit un point matériel M de masse m se 


déplaçant sous l’action d’un champ de force E. Le vecteur vitesse est ü — aoP. et 
l'accélération est F = D'après la loi de Newton, on sait que E = mT. Si a et b 


sont les instants de départ et d’arrivée, le travail de la force le long de L est 


b 
W= | E(M(t)) :u(6) dt = 0: o(t) dt 


b 
2. LC + 00 + 20] àt= 2 | À (lot 1?) dt 
= small v(6) |? — ml v(a) |? 


La quantité q(M) — ul v ||? est l'énergie cinétique : on a donc W = q(B) — q(A), 
où À est le point de départ du mouvement et B le point d'arrivée. 
Supposons que le champ de force possède un potentiel p. On a alors W—p{(A)-—p(B), 
donc g(B) — q(A) = p(A) — p(B) ou encore q(A) + p(A) = q(B) + p(B). 
Dans un mouvement sous l'action d'un champ de force ayant un potentiel, la 
somme de l'énérgie cinétique et de l'énergie potentielle est constante. 


2. Formule de Stokes 
2.1 Formes différentielles 
Définitions 
Si P,Q,R sont des fonctions définies sur un domaine D de l’espace, l'expression 


w = Pdx + Qdy + Rdz s'appelle une forme différentielle de degré 1 sur D. Le champ 
de vecteur P i+Q j +RkK est le champ associé à w. 
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Si V(x,y,z) est une fonction, sa différentielle dV — Ÿ dx + … dy + _. dz est une 
forme différentielle de degré 1 et le champ associé à dV est Grady. 
Différentielle d'une forme différentielle 


Dans la forme différentielle Pdx, remplaçons formellement P par sa différentielle et 
notons d(Pdx) l'expression obtenue : 


d(Pdx) = | dr + 2 qy + PP q2) dx = PP gr dx + LP dy dx + PP dz dx 
0x 0y OZ 0x 0y OZ 
Sur les produits comme dx dy, on calcule comme s’il s'agissait d’un produit vectoriel 


de deux vecteurs : 


- changer l’ordre des termes se traduit par un changement de signe : 


dy dx = —-dx dy , dzdx =-dxdz , dzdy = —dydz 


on a les relations : dx dx = dy dy = dz dz = 0. 


Justification : Ces règles s'expliquent si l’on pense que dxdy est l'aire orientée d’un parallé- 


lépipède infinitésimal défini par un couple (dr, dy) 


porté par les axes : comme le couple (dy. dx) a 

l'orientation opposée, les aires orientées correspon- dy dx dy dy dy dx 

dantes sont opposées. Le couple (dx,dx) définit 

un parallélogramme aplati, donc d’aire nulle. = = 
dx dx 


Avec ces règles, il vient 


d(Pdx) = . dx dx ce (dx dy) + LE (dz dx) ce dx dy + pe de dx 


Ô 0 0 Ô o) 
d(Qdy) = dm dy + Tdi dy + _ dz dy = _ dx dy _ dy dz 


d(Rdz) = LE dx dz + OR dy dz + OR qe dz de dx + … dy dz 


0y Oz 
Pour la forme différentielle w—=Pdx+Qdy+Rdz, on obtient dw=d(Pdx)+d(Qdy)+d(Rdz), 
soit 
do = (OR 0) ayar+ (0P-0R) gear + (22 -0P | ar dy 
Oy Oz Oz  Ox 0x  0y 


Les fonctions composantes de dw sont celles du rotationnel de P i+Q j +RE. 


Définitions 

— Si À,B,C sont des fonctions, l'expression À dy dz + B dz dx + C dx dy s'appelle 
une forme différentielle de degré 2. Le champ de vecteurs associé est Ai+B j+Ck. 

— Si w est une forme différentielle de degré 1, de champ associé E, la forme 


différentielle dw de degré 2, dont le champ associé est Rot( E je s'appelle la 
différentielle de w. 
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Calculons la différentielle d’une forme a = Adyd2:+Bdzdx+Cdx dy de degré 2. On 
remplace À, B et C' par leur différentielle : 


d(Ady dz) = (24 dx+ n dy+ ga a) dy dz = PAdr dy dz+ 94 dy dy dz+Ë a dy dz 


Ô Ô dy 
= ax dyde, car dy dy dz = 0 et dz dy dz = —dydz dz = 0 
d(Bdz dx) = du dz dx = dr dy dz, car dy dz dx = —dy dx dz = dx dy dz 


d(Cdx dy) = D dz dx dy = LC da dy dz, car dz dx dy = —dx dz dy = dx dy dz 


On obtient ainsi 


0A |, 9B , aC 
da = dx dy d 
u (24 +28 420) drayas 


La fonction entre parenthèses est la divergence du champ associé à a. 


Définitions 

— Une expression f(x,y,2) dx dy dz, où f est une fonction, s'appelle une forme 
différentielle de degré 3. 

- Si à est une forme différentielle de degré 2, de champ associé Ë, la forme 
différentielle da = (div E) dx dy dz s'appelle la différentielle de a. 


2.2 Intégrale d'une forme différentielle 
Nous savons définir l'intégrale d’une forme différentielle w = Pdx+Qdy+Rdz sur 
une courbe paramétrée C : c'est la circulation L Pdx+Qdy+Rdz le long de C du 


champ associé à w. 


Intégrale d'une forme de degré 2 sur une surface 

Donnons-nous une surface paramétrée régulière S : c’est l’ensemble des points 
Mu,v) = (æ(u,v),y(u,v),z{u,v)), où le paramètre (u,v) décrit un domaine A (page 
400). Soit à = Ady dz+Bdz dx+Cdx dy une forme différentielle de degré 2, définie 
dans une région de l’espace contenant S. 


Dans le produit dy dz, remplaçons dy et dz par leur différentielle dy = U qu+ 8 dv, 
dz = BE du+ DE do. Avec les mêmes règles du du = —du dv, du du = dv dv = 0, il vient 
_ y 0z dy 0z _ {dy 9z  0y 6z | 
us Ou Au FAR Ov Ou “ne Ou Ov Ov Ou Re 


On calcule de même 


dz dx — (SE 0x _ dz DE) du du , dx dy = (æ 0y _ Or œ) du dv 


Ou Ov Ov Ou Ou Ov Ov Ou 
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Ainsi Ox Ox 


dy dz du dv _— 
(+) Léa | = A oy du dv = (2,24) du dv = H{u,v) du dv 
dx dy LÉ 


Le vecteur Hu, v) est normal à S au point M{u,v) et en no- 
tant Nu, v) le vecteur normal unitaire, il vient H(u, v)dudv= 
Nu, v) | Hu, v) I dudv=N(u, v)da, où da est l'élément d’aire 
sur la surface. 


du 


Notons E = Ai+B j +Ck le champ associé à a. Avec les 
paramètres u et v, la forme a — Adydz+Bdzdx+Cdxdy s'écrit, d’après (+), comme 
le produit scalaire 
E(M{(u,v)) - H(u,v) du dv = E(M(u,v)) + N(u, v) da 
Définition 
Soit a = Adydz+Bdz dx+Cdx dy une forme différentielle de degré 2 et soit 
E = Ai+B j+Ck son champ associé. Re CU de a sur S est 


La= Île E(M{u, v)) )- N(u,v) da, 


où N{u,v) est le vecteur normal à S et da l’élément d’aire sur la surface. 


Si par exemple E est un champ de vitesses de particules, l'intégrale de «a sur S 
est la quantité de matière qui traverse la surface par unité de temps. C’est pourquoi 


cette intégrale s'appelle aussi le flux de E à travers S. 


Exemple. Coupons la sphère de rayon R “ F 
centrée à l'origine par le plan horizontal 
d’équation 2 = a, où 0 < a < R. Considé- 
rons la surface fermée S formée de la calotte 
supérieure de la sphère et du disque hori- 


8Y 


zontal situé dans le plan de coupe. Calculons le flux du champ 

E = (1/2)k à travers S, c'est-à-dire l'intégrale sur S de la 

forme différentielle L drdy. Notons S, la calotte et D le disque qui lui sert de base. 

Flux à travers S+.On paramètre la sphère par les coordonnées sphériques x = 
Rcosôcosy, y = RsinOcosy, 2 = Rsinw, où 0 <0<2r et -r/2<4<T/2. Le vec- 
teur normal à la sphère est alors dirigé vers l’extérieur. En posant a = Rsin a, avec 
0<a<r/2, la calotte est formée des points tels que 0<4<27 et a£<yw<m/2.Ona 


dx dy = d(R cos 8 cos +) d(R sin 4 cos @) — R? sin @ cos ç d0 dp 


r/2 r2r p2 m/2 
1e cn = f Re EP tie — 2x | cos @ dy = 27 R(1- sin a) 
Rsinv à 
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Flux à travers D. En tout point de D, le champ est { 1/a)k, un vecteur constant. 


Le vecteur normal à D orienté vers l'extérieur est N = —k, donc le flux de E à 
travers D est le produit de l'aire de D par (1/a) k-N = —1/a. Puisque le rayon 
2 
de D est Rcos «, ce flux est L di 4 = T( (R cos a)? ? (= =) = RSS 
Sin œ 
Le flux de E à travers S est donc 
2 : 2 
; 1— 
2x R(1 —-sina)-TR Ge SC 2rR — re [1 + (sin a)?] = _rr oo) ; 
sin @ sin @ sin @ 


2.3 Formule de Stokes 


Nous allons considérer des domaines à bord convenablement paramétrés. 


Des surfaces régulières dont le bord est réunion de courbes régulières ; ce sont des 
domaines de dimension 2, leur bord est de dimension 1. 
Exemples : un rectangle plein, un disque, une calotte sphérique ou la surface 
latérale d’un cylindre. 


Des domaines de l’espace limités par des morceaux de surfaces régulières qui 
en constituent le bord; ces domaines sont de dimension 3 et leur bord est de 
dimension 2. 

Exemples : une sphère pleine ou un cylindre plein, l’intérieur d’un parallélépipède 
ou un tore plein. 


Orientation et règles de paramétrage. Rappelons la définition du vecteur 


normal unitaire à une courbe ou à une surface paramétrée. 


En tout point A{(t) d'une courbe paramétrée plane régulière, le vecteur tangent 
unitaire Pi porté par et le vecteur normal unitaire N , forment une base 
orthonormée directe (T', N) (page 315). 


— En tout point M{u,v) d'une surface paramétrée régulière, le vecteur normal unitaire 


est dans la direction du produit vectoriel M à A om (page 400). 


Règle 1. Une courbe C' formant le bord d’une surface S sera toujours paramétrée 
de manière que le vecteur normal à C' et tangent à S soit dirigé vers l'intérieur du 
domaine : pour une surface plane, cela veut dire que si l’on parcourt le bord dans 
le sens croissant du paramètre, alors l’intérieur du domaine est du côté gauche. 

Règle 2. Pour une région de l’espace limitée par une surface, on doit paramétrer 
cette surface de manière que le vecteur normal soit toujours dirigé vers l'extérieur 
du domaine. 


Notation. Si D est un domaine, on note D son bord ainsi paramétré. 
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Exemples. (voir les figures ci-dessous) 

1) Le domaine D; est un disque centré à l’origine, son bord D; est un cercle orienté 
dans le sens de la flèche (figure 1). Si le rayon est À, on peut prendre comme 
paramétrage du bord M(t) = (x(t),y(t)) = (Rcost, Rsint), où t va de 0 à 27 : le 
vecteur normal en (x,y) est 7 —y,x), il est bien dirigé vers l’intérieur du disque. 


2) D, est le domaine compris entre deux disques et son bord 0 D: est constitué de 
deux cercles (figure 2); ceux-ci sont orientés dans des sens différents (le sens des 
flèches est celui qui met le domaine à gauche quand on se déplace sur le bord). 
On paramètre le cercle extérieur comme ci-dessus. Si le cercle intérieur, de rayon 
r < R, est centré en (a,b), on peut le paramétrer par x = a+rcost, y—=b—rsint, 
t allant de 0 à 27 : la normale pointe alors vers l’intérieur du domaine D». 

3)Le domaine D; est un hémisphère, formé des points (x,y, 4/R? — x? — 17), où 
R est le rayon (figure 3). Son bord est le grand cercle dans le plan xOy, orienté 
comme l'indique la flèche. 

4) Le domaine V = {(x,y,2) | x°+y?+2? < R?} est une boule (pleine) de rayon R et 
son bord S —V est une sphère (figure 4). En utilisant les coordonnées sphériques, 
les points de S' sont 


M(8,p) = (Rcosôcosy, Rsin@cosw, Rsiny), où 0 < 0 < 27 et —n/2 < p < 7/2. 


Le vecteur normal en M est Es au = (R cos pg)OM , donc il est dirigé vers 
P 


l'extérieur de la boule, puisque cos > 0. 


y y 
> > 
HA LT 


figure 1 figure 2 figure 3 figure 4 


Formule de Stokes. Soit D un domaine comme ci-dessus et soit w une forme différen- 
tielle définie dans une région contenant D et de degré la dimension du bord de D. Alors on a 


/ u= | de 
ÔD D 


Voyons comment se traduit cette formule selon les cas. 


Cas d'un domaine plan 


Supposons que D est un domaine plan limité par une courbe fermée C. Prenons 


N 


une forme différentielle à deux variables : w = Pdx + Qdy, définie dans une région 
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0Q 
Ôx 


ù  fresos-ff(e-#)u 


Justification. Prenons comme domaine D un rectangle, formé des points (x,y) tels que a<x<b 
et p£y< q. Le bord est constitué de deux segments horizontaux h,; et h_ et de deux segments 


contenant D. On a alors dw = (2 ->) dx dy et la formule de Stokes s'écrit 


verticaux v.+ et v_. Calculons l'intégrale 1 — Î | — ee dxdy en intégrant d’abord pour x fixé : 
D y 


= f ([-2Æ 4) œ= [ [-P(x,q) + P(x,p)] dx 


En paramétrant h_ par (x =t,y = p), où t parcourt [ab], il vient A P dx = [ P(t,p) dt. 
Pour l'intégrale CASE sur h}, l’abscisse du point doit aller de b à a, donc L P dx = 
[ P(&, q) d=- [| P(t,q) dt. On a donc 1= — P dx. Sur les segments verticaux, x er cons- 
tant, la différentielle dx est nulle, donc hi. P de = J P dx =0et 


finalement / = 9n P dx. De même, on a y LT — dxdy= hs Qdy v- 
et il vient VA (a -2) dx rdy= f,, Pdx + Qdy. = 
dy 


Exemple. Calculons l'intégrale 1 = [ A x? dxdy, où D est l’intérieur de l’ellipse C 


d'équation (y — x)? + x? = 1. 


En choisissant P —0 et Q = x", il vient Pdx + Qdy = x° dy et L 
99 _ op À 


_ 9»? PRE 
D 3x”. La formule (1) s'écrit 


| Al 
La [| 32° dxdy = 31 C 
C D 


Paramétrons l’ellipse en posant x — cost et y — x — sint, donc y — sint + cost. On 

a dy =cost-—sint et | a dy = 'u (cost)#(cos t — sin t) dt — . (cost)*dt, car la 
C —T —T 

fonction (cost)*sint étant impaire, son intégrale entre —7 et x est nulle. On obtient 

ainsi 31 = 37/4, d'où I = r/4. Si D est une plaque homogène de densité p, son 

moment d'inertie par rapport à l’axe Oy est donc p/4. 


Cas d'une surface dans l'espace 
Supposons que le domaine est une surface S dans l’espace, bordée par une courbe C. 


La forme différentielle est w = Pdx + Qdy+ Rdz, son champ est E= Pi+Qj +Rk 
et l'intégrale de w sur C = OS est la circulation de E sur C. 


— Le champ associé à duw est Rot( E) et l'intégrale de dw sur S est le flux de ce 
rotationnel. 
La formule de Stokes s'écrit 


| Par+Quy+Ra: = |] (2 De) du dz +( _ 2%) de dx + (98-22) à dy 
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(2) JL Par+Qayrnaz = |[ Roi(E)- Na 


Si un champ de vecteur E est défini dans une région contenant la surface S, la circulation 
de E sur le bord de S est le flux du rotationnel de E à travers S. 


Cas d'un domaine de l'espace limité par une surface fermée 
Soient S une surface fermée et D la région de l’espace située à l’intérieur. 

La forme différentielle est a= Adydz+Bdzdx+Cdxdy, son champ est E=Ai+Bj+Ck : 
L'intégrale de a sur S = 0D est le flux de E à travers S. 

Puisque da = (div E) dxdydz, la formule de Stokes s'écrit 


(3) JJf, (aiv D avdydz = ][ 5. Nada 


Si un champ de vecteur E est défini dans une région de l’espace D bordée par une surface 


fermée S, le flux de E à travers S est l'intégrale dans D de la divergence de E. 


Si la divergence de ÆE est nulle, le flux à travers toute surface fermée 
est nul : on dit que le champ est conservatif. Un champ de vitesses est 
conservatif si dans toute région de l’espace, la quantité de matière en- 


trante par unité de temps est égale à la quantité sortante (exercice 6). 


On a représenté ci-contre le champ (x,y, e*°) : il n'est pas conservatif. 


Exemple. Reprenons la surface fermée S de l'exemple page 428. D’après la for- 
mule (3), le flux du champ E = (1/2)k à travers S est l'intégrale de div E — —1/2? 
dans l’intérieur À de S. Pour calculer directement cette intégrale, intégrons d’abord 
pour 2 fixé entre a et R : la section de À par le plan horizontal à la hauteur z est 
un disque de rayon r(2) = VR? — z?, donc d’aire r(R? — =). En intégrant d’abord 


en + puis en y, il vient 


_— DEEE R PF 6 — 6 
1] (div E) drdytz= |] —_ dodyde= | r(R2_ 22) = dz=T(R-a)+7R? (1-1) 
A Â re a cs R a 


Puisque a = Rsina, cela s'écrit rR(1—-sina)+TR (1- æ ) =TrkR (2- sin a— 1 ) 


sin &œ i 


Sin & 
= 1— sin «)? 
| | A RS mue. 
A Sin © 


et l’on retrouve bien la valeur du flux de E à travers S. 


ou encore 
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2.4 Applications 


Propriété de l'extremum pour une fonction harmonique 
Soit f une fonction harmonique dans une région À de l’espace, région qu’on sup- 
pose d’un seul tenant. Nous allons voir qu’à moins d’être constante, f ne peut avoir 
ni minimum, ni maximum en un point intérieur à À. 

Supposons que f a un minimum en un point M, intérieur à AR. Soit S une petite 


surface de niveau entourant M et soit D le domaine intérieur à S. Puisque le gradient 
de f pointe vers les niveaux supérieurs, on sait qu'en tout point M, le vecteur 


E(M) = Grad;(M) pointe vers l'extérieur de D : cela veut dire que si N(M) est le 


vecteur normal à $ en M, le produit scalaire E(M)-N(M) est positif ou nul, et par suite 


[Fa na as > 0 


D'après la formule 3, l'intégrale ci-dessus vaut 


I = IL div(Grad,) dxdydz = IL Af dxdydz = 0 
car le laplacien Af est nul. On en déduit qu’en tout point MES,ona E(M) -N(M)=0, 


autrement dit E(M) est tangent à S : au voisinage de M, il n’y a pas de niveau 


——— 


supérieur à celui de M, donc E(M) = Grad (M) = 0. Cela étant vrai pour tous les 
points M voisins de Mo, on en déduit que f est constante dans D. 

Considérons maintenant un point MM; quelconque dans D. Par hypothèse, on peut 
joindre M, à M par une courbe M; tracée dans À, où t parcourt (par exemple) [0,1]. 
Pour { assez proche de 0, M, est dans D, donc f(M;) = f(Mo). Soit 7 la plus grande 
valeur de t{ telle que f(M:) = f(Mo). Puisque f(M5) est la valeur minimum de f 
sur À, le raisonnement précédent montre que f est constante au voisinage du point 
M... Si r < 1, on a donc aussi f(M;) = f(M,) = f(Mo) pour des valeurs de { un peu 
supérieures à 7 : c'est impossible, d’après le choix de 7. C’est donc qu’on a Tr = 1 et 
FM) = f(M;) = f(Mo). La fonction f est donc constante sur À. 


Recherche d'un potentiel harmonique. Nous avons montré que dans un fluide 
incompressible en mouvement non tourbillonnaire, le champ des vitesses est de la 


forme —Grad,, où p est une fonction harmonique à l’intérieur du domaine R oc- 
cupé par le fluide. En général, on connaît les valeurs de p sur le bord de R et 
éventuellement la limite de p(M) quand M tend vers l'infini : c’est ce qu’on appelle 
les conditions au bord. 
Supposons que p1 et p2 sont des potentiels harmoniques à l’intérieur de À satisfaisant 
les mêmes conditions au bord. La fonction f = p2—p1 est harmonique dans À et comme 
elle est nulle au bord, f atteint un extremum en un point intérieur à R. D'après ce qui 
précède, f est constante dans À, et comme f est nulle au bord, on a f(M)=0 en tout 
point M de R, c'est-à-dire p1 = p2. 
Le potentiel harmonique p est donc parfaitement déterminé par les conditions aux 
bord du domaine, et il en va de même du mouvement des particules dans le fluide. 
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Calcul d'une aire plane 


Soit D un domaine plan limité par une courbe C. Dans la formule de Stokes {1} 


0Q _9P 
0) 


prenons P(x,y) = —y et Q = 0. Alors —< = 1 et il vient 


Ox 
Aire de D = —y dx 
C 


De même, avec Q{x,y) = x et P —0, on a : Aire de D — Lx. Il est parfois 


commode de faire intervenir les deux coordonnées x et y et d'utiliser la formule 


Aire de D =} fodu-var 
2 Je 


Aire d'un domaine fermé paramétré par les coordonnées polaires 
Prenons dans le plan une courbe fermée C formée des points M dont les coordon- 
nées polaires (r,0) vérifient r = f(8), où f est une fonction dérivable y 
sur un intervalle contenu dans [0,27]. Utilisons la formule précédente M 
pour calculer l’aire du secteur bordé par C, un résultat qu’on obtient ( 

aussi par calcul direct en coordonnées polaires (exercice 1 page 411). 
En tout point de C, on a 


x =rcos0 = f(4)cos , dx = f'(8)cos0 — f(8)sin0 
y=rsin0 = f(8)sin0 , dy= f'(6)sin0 + f(8)cos0 


d'où x dy—y dx = (HO) (cos 0}? + [f(0)]? (sin 9)?) dé = [/(8)]”d8 et l’aire de D est 
à JL. [OT de. 


Exemple. Dans le disque de rayon 1 centré au point P=(1,0), 
enlevons la partie incluse dans un disque de rayon R<2 centré 
à l’origine © : on obtient un domaine D en forme de crois- 
sant. Notons À la pointe supérieure, B la pointe inférieure et 


a l'angle OP,OÀ. 
Le bord de D est formé de deux arcs de cercles : 


l'arc Ci du cercle de centre P, d’équation r = 2cosû , —-a<80< a, 
- l'arc C2 du cercle de centre O, d’équation r=R, -a<0< a. 


Comme les points À et B sont à la distance À de l’origine, l’angle « est déterminé 
par l'égalité R = 2cos a. Paramétrons ce bord dans le sens des flèches indiquées sur 
la figure. Il vient 


1[ Fa0= | 2(cos 0) 40 = | (1 + cos 28) dû = 2a + sin 2a 
Ci = 


(02 —® 


1[ r? d@ = À [l R? d@ = -aR? = —-4a(cos a)? 
2 C2 2 a 
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L’aire de D est la somme de ces deux intégrales, c'est-à-dire 2 [1- 2(cosa)?] +sin2a— 
sin 24 — 2a cos 2&. 


2.5 Le planimètre 


Le planimètre, inventé par J. Amsler en 1854, est un instrument qui permet de 
mesurer l'aire plane délimitée par une courbe fermée. 


Al 


Description. L'appareil est constitué de deux tiges OT et TA de même longueur 
et articulées en 1. 


— L'extrémité © peut être fixée en un point d’un support 
plan, tandis que l'extrémité À peut bouger librement 
sur ce plan. 

— Sur la tige 1 À est fixée une roulette d’axe ZA ; on la mu- 
nit d’un compte-tour, car elle est destinée à enregistrer 
les mouvements de rotation de la tige. 


Fonctionnement. On fixe O en un point du plan de la courbe et l’on fait par- 
courir la courbe à l'extrémité À de la tige libre. Pendant le mouvement, la roulette 
tourne par frottement sur le support. 


Le nombre de tours de la roulette est proportionnel à 
l'aire intérieure à la courbe. 


Il suffit donc d’étalonner l'instrument sur un carré unité pour avoir un outil qui 
mesure les aires. 


Explication. Pour repérer les points du plan, prenons des axes orthonormés d’ori- 
gine ©. Calculons les coordonnées (p,q) de Z en fonction des coordonnées (x,y) de A. 


Notons a la longueur commune des tiges OT et TA. Le triangle 
OTA étant isocèle, la hauteur ZH issue de J est une médiane. En 
posant d=OA=20H, il vient donc (théorème de Pythagore) H1?=— 


OP OPEL 


4 


. Les coordonnées du vecteur unitaire porté 
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par OÀ sont ( (x/d, y/d), donc Hi a pour coordonnées ,/a? — (d2/4)(—y/d,x/d). Les co- 
ordonnées de OH sont (x/2,y/2) et OI=OH+HI, donc les coordonnées du point J sont 


x y fAd-(x°+y?) LY., x 44° +y où 
2,2 » 4 + 
2° +y 2 2 a+ 


Si M est un point du plan accessible au planimètre, amenons À en ce point et 


Coordonnées de I : p= 


notons E(M) le vecteur unitaire directement orthogonal à IM. Les coordonnées de 
IM étant (x—p,y-q), celles de E(M) sont (P,Q) = | (ya) , z-p). 
On définit ainsi un champ de vecteurs unitaires dans une région du plan. 


Premier point. Le nombre de tours de roulette est proportionnel à la circulation du champ 
E(M) le long de la courbe C!. 


Si l’on déplace M dans l'axe de la roulette, elle ne 


tourne pas. Si l’on déplace M dans le sens de E(M) F 
elle tourne d’une quantité proportionnelle au dépla- 
cement. Pour un petit déplacement dM de direction 
quelconque, la rotation de la roulette est proportion- 


nelle à la composante de dM sur E (M), c'est-à-dire au produit scalaire E(M): aM. 
Quand M parcourt la courbe, l'accroissement dM reste tangent à C' et le nombre de 


tours de roulette est donc proportionnel à L E(M) : aM. 


Deuxième point. En tout point M, on a Rot( E) = lr où k est un vecteur unitaire 
(6 


orthogonal au plan. 


Aa? —d? 0Q 1 2axy a OP 


E t d=x+y et u = ffet 
n posan x°+y" et u P on a en eïte 3Q nd dy 


—1  2arty 0Q _8P _1 
9a nd” donc x dù 2: 


Troisième point. Soit D l'intérieur de la courbe. D’après la formule de Stokes, la 


circulation du champ E(M) ) le long de C'est 


E(M) -d = [| es 22) ax dy = Î/ L'axdy = L aire de D. 
C D & (A 


On en déduit que l'aire intérieure à C' est proportionnelle au nombre de tours 
enregistrés par la roulette quand M parcourt la courbe. 
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@ 1. 


@ 2. 


a Exercices mms 


Gradients conjugués. Soit E — Pi+Qj un champ de vecteurs défini dans le plan. 
Définissons le champ de vecteurs E=-Qi+Pj. 


a) Montrer qu’en tout point M du plan, le vecteur E°(M) se déduit de E(M) par 
rotation d'angle he 


b) On suppose que E = Grad,, où est une fonction harmonique. Montrer que 
Rot( E°) = 0. En déduire qu’il existe une fonction 4° telle que E° = Grade et 
que w° est harmonique. On dit que w et w° sont des potentiels conjugués. 


cd On prend E = (a?) à —2ryj. Montrer que le champ E est le gradient d’une 
fonction 4. Calculer w(x,y) et le potentiel conjugué 4°(x, y). 


Un modèle d'écoulement. On considère le mouvement plan non 
tourbillonnaire d’un fluide autour d’un cylindre fixe de rayon a 
et d’axe vertical. Plaçons l’origine © des coordonnées sur l'axe du 
cylindre, Ox étant l’axe de symétrie du mouvement. En appelant 


Ur: Vy les composantes de la vitesse d’une particule dans le fluide 


E — 2 
et r la distance à l’origine, le champ des vitesses est v.i+v,j=Grad,,, où ÿ=x+ A . 


a) Écrire w(x,y) au moyen de r et 0. En déduire que la fonction 4 est harmonique 
22 2 22Y 
a a et Uy= a —7—. 
4 F 


(se reporter page 372). Montrer que vx = 1 


2 


b) Montrer que le potentiel conjugué (voir l'exercice ci-dessus) est 4° = y— = En 
Tr 
déduire que les lignes de courant sont les courbes d’équation @°(x,y) = K, où 


K est une constante. 


c) À l’aide d’un ordinateur, vérifier que les lignes de courant ont l'allure montré 
figure 1. Sur la figure 2, on voit aussi les courbes d’équation 4 — constante : ce 
sont les lignes d’égale pression. En chaque point, ligne de courant et ligne d’égale 
pression sont orthogonales. 


figure 1 figure 2 


En réalité, cette modélisation n’est pas correcte dans la région juste en aval du cy- 
lindre : on y observe un effet de sillage plus ou moins important selon la viscosité 
et la vitesse; aux vitesses élevées, il se forme des tourbillons. 
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3. 


@ 5. 


.Soit E un champ de vecteurs tel que div E = 0. Considérons un 


Le champ électrique. Le champ électrique créé en un point M de l’espace par une charge 


q placée à l’origine © des coordonnées est E(M) = FM), où F(M) = La 
_- £o r 
u étant le vecteur unitaire dirigé par OM et r la distance OM. 
a) Calculer la Re es div F = : ( 2) + _ (£) + _ (4). En déduire que 
le flux de E à travers une surface fermée n’entourant pas la charge est nul. 


b) Soit S la sphère centrée à l’origine et de rayon a. Montrer qu’en tout point M de 
OM 
a 


$, le vecteur normal unitaire dirigé vers l'extérieur est N — et que F: N= . 
a 


En se rappelant que l'aire de S est 4ra?, en déduire que le flux de E à travers 
S'est | E-N da = _ 


€o 
Le flux du champ électrique à travers une sphère centrée sur la charge ne dépend 
donc pas du rayon de la sphère : c’est la loi de Gauss en électrostatique. 


. Le champ magnétique. Un « élément de courant électrique », formé a 


d’un fil rectiligne de longueur infinitésimale d£ placé en un point À 


O et parcouru par un courant d'intensité j, crée en tout point 
 . dékNü 7 
M un champ magnétique dB(M) = a où kestle | 
T 
vecteur unitaire dans la direction du fil dirigé dans le sens du dt 


A 
k 
ce 


courant et u le vecteur unitaire dans la direction OM. On choisit | 
l’origine des coordonnées en © et l’axe OZ dirigé selon k. 


Calculer les composantes B;,B,,B;, du champ dB(M) et montrer que la divergence 
de dB est nulle. 


Le champ magnétique créé par un courant est conservatif. 


Déterminer la fonction y+ f(y) pour que le champ ef (y) i+e Inyj dérive d’un 
potentiel. Quel est le potentiel qui tend vers 0 quand (x,y) tend vers (1,0) et vers 
1 quand (x,y) tend vers (0,0) ? On trouve f(y) = yIny— y+c, où c est une constante 


1 __ —e 
ee | et d 2 à 


et le potentiel est p = — [e°(ylny —y+c) + d] , avec € — 


tube de champ basé sur une surface s : il est constitué des 
lignes de champ aa’ issues des points de s; limitons ce 
tube par la surface 5’. E (a!) 
Montrer que le flux de E à travers la surface latérale 
du tube est nulle. En déduire que le flux de E à travers 
une section quelconque du tube ne dépend pas de cette section (flux conservatif). 
Montrer que si le tube est très étroit et les sections s et s’ orthogonales aux lignes 
de champ, les aires de s et s’ sont inversement proportionnelles aux intensités || E I 
et || E' | du champ sur s et 5. 
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Chapitre 15 


Équations différentielles 


Une équation différentielle est une relation entre une fonction x(t) et ses dérivées 
x/(t),x"(t),... Dans le cas le plus simple, elle permet d’exprimer pour tout t, la 
valeur de z/(t) au moyen de x(t) et de t, sous la forme x’(t) = f(t,x(t)), où f est 
une fonction de deux variables. Une telle équation s'écrit simplement x’ = f(#,x). 


Exemples 


1)æ — —2tx est une équation différentielle, du premier ordre car elle ne fait inter- 
venir que la dérivée première. Une solution est une fonction u(t) dérivable telle 
que u'(t) = —2tu(t) pour tout t. 


La fonction u(t)=exp(—t?) est solution, car w/(t)=—2texp(—t?)=—2tu(t). De même, 
pour tout nombre À, la fonction Àexp(—t?) est solution. 

2) x! = x est aussi une équation différentielle du premier ordre. Ses solutions sont 
les fonctions dérivables ut) telles que u’(t) = u(t) pour tout £ : la fonction 
u(t) = exp(t) est une solution, de même que Àexp(t) pour tout nombre À. 

3]x/=—x/+2x—2expt est une équation différentielle du second ordre, dont les solutions 
sont les fonctions u(t) (deux fois dérivables) vérifiant w”(t) = u'(t) +2u(t) —2expt 
pour tout {. 


Pour tous nombres À et y, les fonctions Aexp(2t) +uexp(—t)+expt sont des solutions 


de cette équation. 
4) Si w est un nombre donné, la fonction u(t) = sinwt est solution de l’équation dif- 
férentielle x” +uw?x = 0, car on a w/(t) = wcosut et u"(t) = —w? coswt = —-w?u(t) ; 
de même, v(t) = coswt est une solution. 


Les solutions sont toutes les fonctions À cos wt + usinwt, où À et y sont des 
nombres quelconques. 
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1. Equations différentielles du premier ordre 

1.1 L'approche graphique 
Soit x’ — f(t,x) une équation différentielle du premier ordre, la fonction f étant 
définie dans un certain domaine D du plan. 
Supposons que u est une solution et soit M = (r,b) un point situé sur le graphe de 
u. On a b=u(r), donc w'(r) = f(r,b) est un nombre qui ne dépend que du point 
M. Puisque la tangente en M au graphe de w a pour pente w/(r), on en déduit les 
propriétés suivantes. 
— En tout point (t,x) du graphe d'une solution, la tangente a pour pente f(t,x). 
— Dans une région où f(t,x) > 0, les solutions sont croissantes; dans une région où 

ft, x) < 0, elles sont décroissantes. 

Voici comment on peut deviner l'allure des solutions. En tout point M =(t,x) de D, 
dessinons un petit segment centré en M et de pente f(t,x) : on obtient un champ 
de directions. Par définition, une solution de l'équation différentielle est une fonction 
dont le graphe est tangent en tout point aux segments ainsi dessinés. 


Exemple. La figure ci-contre montre le champ de directions pour l'équation dif- 


férentielle x! = —2tx? : en tout point (f,x), nous avons placé TA 

un segment de pente f(t,x) — —2tx?. Ainsi, sur l’axe des or- | [IIMNill | 
données (f = 0), les segments sont tous horizontaux et il en LLUKK 
va de même sur l’axe des abscisses (x — 0). Il suffit de relier 777 KR eu 
les segments pour avoir l'allure de quelques solutions. On voit | | | AN | | | | 


que la fonction nulle, dont le graphe est l'axe des abscisses, 

est solution. Puisque —2tx? a le signe de —{, les solutions sont décroissantes pour 
t > 0 et croissantes pour + < 0. 

En deux points (t,x), (—t,x) symétriques par rapport à Ox, les pentes du champ 
de directions sont opposées, car on a f(—t,x) = —f(t,x) : en conséquence, si une 
solution est définie sur un intervalle de la forme |-a,a{, c'est une fonction paire. 


Les isoclines 

Si p est un nombre donné, les points (t,x) où les solutions ont une tangente de pente p 

vérifient f(t,x)=p. C'est l'équation d’une courbe, appelée l'isocline pour la pente p, car le 

long de cette courbe, le champ de direction garde la pente constante p : on peut garnir 

l'isocline de petits segments de pente p. En traçant quelques isoclines pour différentes 

valeurs de p, on a un aperçu du champ de direction et de l’allure des solutions . 
L'isocline pour la pente p est la courbe d'équation f(t,x) = p. 

Exemple 1. Considérons l'équation x/=x-—t. L'isocline pour : 

la pente p est la droite d'équation x — {+ p, parallèle à la 

première bissectrice des axes. La figure ci-contre montre les 

isoclines pour les pentes p — 2, 1, 0 et —1. 
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 L'isocline pour la pente 0 est la bissectrice d’équation x — t. 
Dans le demi-plan x > t (c’est-à-dire au dessus de la bissectrice), les solutions 
sont croissantes ; en dessous, elles sont décroissantes. 
Si une solution passe par un point de la bissectrice, elle y a un maximum. 
 L'isocline pour la pente 1 est la droite x — {+1 de pente 1 : par suite, la fonction 
u(t) = t+1 est solution. 


Exemple 2 : l'équation logistique. Voici un modèle très simple pour l’évolu- 

tion d’une population en milieu fermé (par exemple, des bactéries en culture ou une 

population de lapins sur un îlot). Les observations effectuées par unité de temps ôt 

(la durée d’un cycle reproductif) conduisent aux hypothèses suivantes : 

- l'augmentation de population due à la reproduction est proportionnelle à l'effectif 
initial ; 

la compétition pour la nourriture induit une mortalité proportionnelle au carré de 


l'effectif initial. 


Appelons x(t) l'effectif à l’instant £. 


On a ainsi x(t+ôt)—x(t) = kx(t)ôt a(æ(t))”ôt, où k et a sont des constantes positives. 
a(t + Ôt) — x(t) 
ôt 
tend vers la dérivée x’(t), vitesse d'évolution de la population, d’où la relation 


z'(t) = kr(t) — a(x(t))”. 


Ainsi, la fonction x(t) est solution de l'équation différentielle 


Pour avoir un modèle continu, on fait tendre ô{ vers 0 : le rapport 


x! = kx — ax? 


(équation logistique) 
Supposons k = 1,8 et a — 0,04. L'équation s'écrit x’ = 1,8x — 0,04x?, ou encore 

x! = 0,04x(45 — x) 
L'isocline pour la pente 0 a pour équation 0,04x(45—x) = 0, dont les solutions sont 
æ—=0 et x — 45 : l’isocline pour la pente Ü est donc formée de deux droites, l'axe 
des abscisses (x — 0) et la droite horizontale d’équation x — 45. Puisque le champ 
de directions est horizontal sur chacune de ces droites horizontales, on obtient deux 
solutions constantes, correspondant à des effectifs stables au cours du temps : 


- la fonction x(t) = 0 quel que soit #, 


-et la fonction x(t) = 45 quel que soit {; si à un instant initial, la population est 
de 45 individus, l'effectif reste stable. 


En tout point tel que x=m, le champ de directions a pour pente p(m)=0,04m(45—m) : 
la droite d'équation x = m est l'isocline pour la pente p(m). 


Si 0<m<45, alors p(m) est positif : les solutions sont donc croissantes dans le domaine 
0 <x<45. Si m>45, on a p(m) <0 : les solutions sont décroissantes dans le domaine 
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æ > 45. Voici des valeurs de p(m), le champ de directions et quelques solutions : 


Tim 407% 8 À 

On observe que, mis à part la solution nulle, toutes les solutions x(t) ont pour 
limite 45 quand { tend vers +oo : quel que soit l'effectif initial, pourvu qu'il soit 
non nul, la population tend vers la valeur stable de 45 individus. Nous résoudrons 


analytiquement l'équation page 448. 


1.2 Propriétés générales des solutions 
Définition 
Une solution de l'équation différentielle x’ — f(t,x) est une fonction x(t) dérivable 
et définie sur un intervalle ouvert J, telle que x/(t) = f(t,æ(t)) pour tout t € J. 


Pour déterminer une solution x(t), il suffit le plus souvent de choisir un nombre t 
et la valeur x, de la solution pour t=t9 : on dit que (to,%0) est une condition initiale. 
Notons D le domaine de l'équation x' = f(t,x), c'est-à-dire le domaine de définition 
de la fonction f, et supposons f continue sur D. 


Théorème 
a) Si deux solutions passent par un même point, leurs graphes sont tangents en ce point. 


b) Supposons que la fonction f a des dérivées partielles al et el continues. Pour tout 
point (to,xo) de D, il existe une unique solution x(t) telle que x(to) = to. 
Une solution est donc entièrement déterminée par sa condition initiale. 
c) Le graphe de chaque solution va jusqu'au bord du domaine D (éventuellement à l'infini). 


La propriété (a) est évidente : si A=(7,a) est un point commun aux graphes de deux solu- 
tions 1 et æ2, la tangente en À au graphe de x1 a pour pente f(r,a) et il en va de même 
de la tangente en À au graphe de x2 : ces deux graphes sont donc tangents au point À. 
L'énoncé {b) affirme deux propriétés : 
Il existe toujours une solution x(t) satisfaisant la condition initiale x(to) = x, 
et cette solution est unique : cela veut dire que si x1(t) et x2(t) sont des solutions 
prenant la même valeur x, en t = to, alors on a æ1(t) = æ2(t) quel que soit t. 


Conséquence. Si f a des dérivées partielles continues dans D, alors les graphes de 
deux solutions différentes n'ont aucun point commun. 
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Dans ce cas, les graphes des solutions forment une partition du domaine de l'équation : 
c'est ce qu’on voit sur les figures précédentes. À chaque fois que nous pourrons calcu- 
ler explicitement les solutions d’une équation différentielle, nous vérifierons toutes ces 
propriétés. 


Définition 
] Une équation différentielle de la forme x’ — f(x) est dite autonome. 
Si l’on imagine que t représente le temps, une équation différentielle autonome exprime 
que la relation entre la fonction x et sa dérivée ne dépend pas du temps. Dans les 
applications, on rencontre de nombreuses équations différentielles autonomes. L'équation 
logistique étudiée dans le paragraphe précédent est autonome. 


Proposition. Si x(t) est solution d'une équation différentielle autonome, alors pour tout 
nombre a, la fonction y(t) = x(t+ a) est solution. 


Démonstration. On a en effet y/(t) = x'(t+ a) = f(x(t+a)) = f(y(t)), donc la fonction y 
est solution de l'équation différentielle. a 


Traduction géométrique : Si x(t) est une fonction et a un 
nombre, le graphe de la fonction {+ x(t+ a) s'obtient en transla- 
tant le graphe de x(t) de la quantité —a parallèlement à l'axe des 
t. La propriété ci-dessus se formule donc de la manière suivante. 


Si l'équation est autonome, alors en translatant parallèlement à l'axe des + le 
graphe d'une solution, on obtient encore le graphe d'une solution. 


1.3 Équations différentielles linéaires 


Définitions 

Une équation différentielle linéaire du premier ordre est de la forme x’ = a(t)x + b(t), 
où a(t) et b(t) sont des fonctions continues sur un même intervalle J. L'équa- 
tion différentielle x’ = a(t)x s'appelle l'équation homogène associée et la fonction b 
s'appelle le second membre. 


Le domaine de l'équation est l’ensemble des points (#,x) tels que t € I. 


Résolution de l'équation homogène x’ — a(t)x 


Soit A(t) une primitive de a(t) sur l'intervalle I. 


Proposition. Les solutions de l'équation homogène x’ = a(t)x sont les fonctions u(t) = 
Kexp[A(t)|, où K est un nombre quelconque. 
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Démonstration. Soit u(t) une fonction dérivable sur 1. Posons y(t)=u(t)exp[—A(t)], de sorte 
que u(t)=y(t)exp|A(t)]. Puisque exp[A(#)] a pour dérivée 4’(t)exp[A(t)]=a(t)exp[A(t)], on a 
u'(#) = y/(t) exp A(E)] + a(t)y(t) exp[A(#)] = y/(#) exp[A(#)] + a(tju(t). 

La fonction « est donc solution de x’ = a(t)x si et seulement si y'(t) = 0 pour tout te I, 
c'est-à-dire si et seulement si y est constante sur J. Eu 


Remarque 

Cette résolution s'applique à l'équation z/ = az, où a est un nombre complexe : 
puisque la dérivée de 2(t) = e%* est z/(t) = ae%Ÿ = az(t) (proposition page 321), la 
démonstration ci-dessus montre que les solutions à valeurs complexes de l'équation 
z! = az sont les fonctions {+ ke‘*Ÿ, où k est un nombre complexe quelconque. 


Résolution de l'équation complète x’ — a(t)x + b(t) 
Proposition. Si s(t) est une solution de ne x’ = a(t)x + b(t), alors les solutions 


de cette équation sont les fonctions x(t) — K exp{[A(t)] + s(t), où A(t) est une primitive 
de la fonction a et K° une constante quelconque. 


Les solutions de x'=a(t)x+b(t) s'obtiennent en ajoutant à une solution particulière 
s(t), une solution quelconque de l'équation homogène x’ = a(t)x. 
Démonstration. Soit x(t) une fonction dérivable. Posons y(t) = x(t) — s(t), donc æ(t) — 
y(t) + s(t). On a s'(t) — a(t}s(t) = b(t), donc 
V'(E) — a(E)y(e) = 2°(8) — s'(8) — a(t)x(e) + a(t)s(t) = (6) — a(t)x(t) — b(E) 
Pour que x(t) soit solution de l’équation x/=a(t)x+b(t), il faut et il suffit que y'(t)—a(t)y(t)=0 
quel que soit { € I, c'est-à-dire que y soit solution de l'équation homogène. O 


D'après la proposition, il suffit de trouver une solution particulière s(t) de l’équa- 
tion pour en déduire toutes les solutions. Par exemple, pour l'équation x’ = x—t de 
l'exemple 1 page 440, les solutions sont toutes les fonctions x(t) = Ke! +++1, car 
s(t) = t+1 est une solution particulière. 


Recherche d'une solution particulière. Supposons qu’on a calculé une primi- 
tive A(t) de la fonction a(t), donc aussi une solution non nulle u(t) de l'équation 
homogène. Cherchons une solution s(t) de x’ — a(t)x + b(t) sous la forme 
s(t) = X(tju(t), où À(t) est une fonction à déterminer. 
On a uw’(t) = a(t)u(t) donc 
s'(t) = Aftju’(t) + X'(tju(t) = X(tja(tju(t) + X'(tju(t) 
at) X(#)u(t) + b(t) 
Pour que s’(t) = a(t)s(t) + b(t), il faut et il suffit que X’(t)u(t) = b(t). Puisque 
1/u(#) = exp[—A(#)], 


cette condition s'écrit 


N'() = b(t) exp[—A(t)] 
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Il suffit ainsi de calculer une primitive À(t) — Î ‘ b(r)exp[—A(r)] dr et la fonction 
X(t)u(t) sera une solution particulière de l’équation x’ — a(t)x + b(t). 

Cette méthode de recherche d’une solution particulière s'appelle la méthode de variation 
de la constante. 


Détermination d'une solution au moyen des conditions initiales 

Donnons-nous des conditions initiales to € I et xo quelconque. 

Première méthode. Les solutions s'écrivent x(t) = Kexp[A(t)] + s(t), où s(t) est 
une solution particulière et À un nombre quelconque. Pour que x(to) = x, il suffit 
donc de choisir le nombre X tel que x0 = Kexp[A(to)] + s(to). 

Seconde méthode. Choisissons pour À la primitive de a(t) telle que A(to) = 0. 


— Si l’on pose }({) = f'ü(r) exp[—A(r)] dr, alors À(t5)=0 et la solution particulière 
s(t) = A(t)exp[A(t)] vérifie s(to) = 0. 


— On sait que les solutions sont les fonctions æ(t) = Kexp{[A(t)] +s(t), où K est 
une constante. Puisque A(to) = s(to) = 0, il vient x(to) = K. 


t 
Puisque A(t) =] a(r) dr, la solution telle que x(to) = 0 est donc 
0 


t 
æ(t) = roexp[A(t)] + A(t)exp[A(t)] , où À(t) -| b(r)exp[—A(r)] dr 
to 
Exemple 1. Le refroidissement d’une quantité de matière dans un courant d’air 
est proportionnel à la différence de température avec l'air. Soit 0 la température de 
l'air, maintenue constante. Supposons que le corps est à la température initiale 7. 
Si l’on note T{(f) sa température au bout d’un temps t, on a donc 


T'(t) = -aÎT(t) — 6], où a est un coefficient positif. 


En posant æ(t) = T(t) —06, il vient x/(t) = T'(t) = —a[T(t) — 6] = -ax(t), donc 
x(t) = Xe %, où À est une constante. Puisque T(t) = x(t) +0, on obtient une solution 
de la forme T(t) = Xe + 0. 

Supposons que l'air est à 20 degrés et que le corps passe de x 

100 degrés à 60 degrés en un quart d’heure. En comptant le 
temps en heures, on a donc T(0) — 100 et T(1/4) = 60. a 
Il vient 100 — T(0) = À+20, d'où À = 80, puis 60 —T(1/4)— 60 
Xe-%/4 + 20 = 80e-%/4+ 20, d'où e-%1—1/2 et a=4ln2. 40 
Finalement, la loi de refroidissement du corps est 20 


T(t) = 80e-4%2t + 20, où + est compté en heures 


1 2 31 


Exemple 2. Considérons un circuit électrique formé d’une résistance R, d’un con- 
densateur de capacité C' et d’un générateur de force électromotrice Et) = E,, sinwt 
placés en série. Si le condensateur est initialement déchargé, sa charge q(t) à l'instant 
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t est solution de l'équation différentielle 


R 1 + — E,, sin wt 


d OC 
A . 2 . « = : : 
Résolution de l'équation homogène q’ — Ro de Les solutions sont les fonctions 
K'exp (SE). où K est une constante quelconque. 


Recherche d'une solution particulière. Elle est de la forme s(t) — À(t) exp (=). 


E 


SET 
où N'(t)exp ( 2 
X(t) sont de la forme (page 321) 


) = _ snmuwt. Il vient À(t) = Êu exp (5) sinwt. Les primitives 


(a sin wt + bcoswt) exp ( ) 


RC 
EnC(RC : 
En identifiant, on obtient a = Em C ; © = — à et la fonction 
1 + (RCw) 1+ (RCw) 
s(t) = asinwt + bcosw est donc une solution particulière. 
La solution générale de l'équation est ainsi q(t) = K exp (=) + asinwt + bcoswt. 
La condition initiale q(0) — 0 s'écrit 0 — X +b, d’où la fonction de charge du 
condensateur : 
EnC —$ q(t) 
Qt) = — [RCwexp (=) + sin wt — RCu cos ut 
@ 1 + (RCw) RC 
Comme les valeurs de exp(—t/RC') deviennent en général ra- 
pidement négligeables, on voit s'installer un régime permanent t 


quasi-périodique, de quasi-période celle du générateur. 


1.4 Équations différentielles à variables séparées 


Définition 
Si f et g sont des fonctions, une équation différentielle de la forme x’ = f(x)g(t) 
est dite à variables séparées. 


Une équation autonome est à variables séparées. 


Exemple. Résolvons l'équation différentielle x! — —2tx? dont nous avons dessiné 
le champ de directions page 440. La fonction nulle : x(t) = 0 quel que soit t, est une 
solution. Cherchons maintenant les solutions dans le domaine x # 0. 


ne es UE) , —æ(t) __d {1 . 
L'équation s’y écrit — —21. Puisqu'on a = , il vient 
7 ÿ x(t)? 4 x(t)? dt \x(t) 
_ (4) = it LP), donc 25 =t+C, où C est une constante. Ainsi, dans 
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le domaine x 0, les solutions sont 
x(t) = ne avec C' constant. 
+C 
Nous avons déjà remarqué que le sens de variation des solutions d’une équation diffé- 
rentielle est donné par le signe de f(t,x) : ici, les solutions sont croissantes pour t<0 et 
décroissantes pour {>0. L'intervalle de définition d’une solution dépend du signe de C. 


Supposons C > 0. La solution s(t) — est positive, définie sur R et tend vers 


FEC 


0 quand t tend vers co ; le maximum est atteint en t{ — 0 (figures ci-dessous). 

Supposons C < 0. Posons C'=— —a?, avec a > 0. Rappelons que, par définition, une 
solution est toujours définie sur un intervalle. La formule de résolution détermine 
trois intervalles de définition : Z; =]-a,al, 1 = ]-c,—al et 13 = ]a, +, donc 
trois types de solutions. 


- Posons so(t) = - pour t e]-a,al. Cette solution s, est à valeurs négatives 
— & 


et possède des asymptotes verticales en {=+a : on a lim s0(t) = lim sp(t) = —00. 
—a ——a 


 Posons s,(t) = ee pour t Ela, +. C’est une solution à valeurs positives, 
— 


décroissante et de limite 0 quand t tend vers +0 ; puisque s;(t) tend vers +oo 
quand t tend vers a par valeurs supérieures, cette solution a une asymptote 


verticale en a. 
De même, la fonction s_(t) — De pour t E]J-o,-—al, est une solution à 
valeurs positives, croissante de O0 à +oo. 
La seule solution qui satisfait une condition initiale æ(to) —0 est la fonction nulle. Si 
l 


400, la solution telle que x(t)=x9 s'obtient en calculant C pour que %9= FE 
0 


s(t) s_(#) 


L s.(#) 


—@ a 


T T > 
t 1 : t —@ | a LA t 


En observant simplement le champ de directions, il n’est pas commode de deviner 
les solutions s, et s_. 


Résolution d'une équation x’ — f(x)g(t) 
Supposons que, dans l'équation, les fonctions f et g ont des dérivées continues. 


a} On commence par chercher les solutions constantes. La dérivée d’une telle solution 
æ(t) est nulle, donc en appelant m sa valeur, il vient 0=x/(t)= f(æx(t))g(t)=f(m)g(t) 
pour tout t. Si g n’est pas la fonction nulle, on a donc f(m) — 0. 


Toute solution constante a pour valeur un nombre m tel que f(m) = 0. 
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dx 1 


b) Les solutions non constantes vérifient — = g(t) ou encore 
dt f(x(t)) 
dx 
= = g() dt 
f(x) 


La solution s(t) telle s(to) — xo s'obtient en intégrant chaque membre : 


[- f'onar 


ce qui exprime la relation entre s(t) et t. 


Exemple : l'équation logistique. 11 s’agit de l'équation autonome (page 441) 
a —kx—ax?, où k et a sont des nombres positifs. 


Menons la résolution dans le domaine x > 0. 


Recherche des solutions constantes. La valeur d’une solution constante est 
un nombre m > 0 vérifiant km — am? = 0, donc m = k/a : il y a une seule solution 
constante, définie par x(t) = k/a. 


Recherche des autres solutions. Puisque les graphes de deux solutions diffé- 
rentes n’ont aucun point commun, les solutions non constantes ne prennent pas la va- 
leur k/a : leur graphe est donc contenu dans l’un des domaines 0<x<k/a ou x>k/a. 
Soit s(t) la solution telle que s(0) — x, où 29 est un nombre positif différent de 
k/a. Si l'on a 0 < x < k/a, alors le graphe de s est dans le domaine 0 < x < k/a; 


si x) > k/a, le graphe de s est dans le domaine x > k/a. 
dx 


En écrivant l'équation sous la forme — dt, la fonction s(t) est déterminée 


2 
TX 
par la relation 


s(t) d t 
(1) | — 5 — | dr =t 
æ KtT—ar 0 


Pour calculer l'intégrale, cherchons les nombres a et 5 tels que 


x(k—ax) x k—ax 
En identifiant, on trouve a = 1/k, 6 = a/k et 


1 = À Le a 
a(k—ax) klx k—ax 


: dx _ + œ DE 
Il vient Î he [nzx—In|k- ax|] = £ In = 44 et (1) s'écrit 
1 
L s(t) Im 2 1 s(t) T0 =. 
k |k—as(t)] |k—axol k k—as(t)| \|k—-axol 
En posant C = "> 0, on obtient 
[k—axol 
A | 
(2) s( ) _ Ceft 


k—as(t)] 
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Supposons 0 < xo < k/a.On a alors 0 < s{t) < k/a pour tout t, c'est-à-dire 
s(t) 


= EN — kt LS 
k—as(t) > 0. Il vient RE Cet, d’où 
Ck 
S(t) = —— , pour tout {tER. 
Œ Cake * F 


Quand t va de —oo à +0, e À! décroft de + à 0, donc s(t) croît de 0 jusqu’à 
k/a = Jim s(6). 
Supposons xo > k/a. On a s(t)>k/a pour tout t, donc k—as(t) <0 et |k—as(t)| = 
as(t)—k. On obtient ainsi 
Ck 
le = 08. 
@ Ca 


Puisque Ca= _— et ato—k>0, on a Ca>l et la borne a=-7n(Ca) de l’inter- 
a 


, pourt> ee m(Ca). 


valle de définition est un nombre négatif : la solution est donc bien définie en t—0. 
Quand t tend vers & (par valeurs supérieures), le dénominateur tend vers 0 et 
s(t) tend vers +co : la solution a une asymptote verticale en à. Quand t tend 
vers +00, et tend vers 0 et s(t) tend vers k/a. 
Dans le domaine x > 0, toutes les solutions ont pour limite k/a quand t tend vers 
+00 : la population tend vers l'effectif stable de k/a individus, comme nous l’avions 
observé sur le champ de directions page 442. 
Puisque l'équation logistique est autonome, si l’on translate le graphe d’une solution 
parallèlement à l’axe du temps, on obtient encore le graphe d’une solution. 


T À 


k/a 


T0 


Eu À 


Sur la figure de droite, l'effectif x(t) est représenté par un point M sur une 
demi-droite d’origine ©. Si l’on se donne la position initiale, le point M décrit une 
trajectoire sur cette demi-droite. On voit qu'il y a trois trajectoires possibles : 


- Si la position initiale est le point d'équilibre E d’abscisse k/a, alors M reste en 
E : l'ensemble {E} est une trajectoire. 

— L'intervalle T_ —]O; E[ est la trajectoire correspondant à une position initiale située 
entre Æ et l’origine. Un point qui décrit cette trajectoire tend vers l'équilibre E 
quand le temps tend vers l'infini. 

Pour une position initiale située au delà de Æ, la trajectoire est la demi-droite ou- 
verte limitée par Æ. Sur cette trajectoire, le point tend aussi vers l'équilibre quand 
le temps tend vers l'infini. 
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2. Équations différentielles linéaires d'ordre 2 


Nous allons étudier les équations différentielles linéaires faisant intervenir la fonction 
x ainsi que ses deux premières dérivées x’ et x”. Ce sont des équations très courantes. 


2.1 Propriétés générales 
Définitions 
Une équation différentielle linéaire d'ordre 2 est de la forme x” +p(t)x’ + q(t)x = b(t), 
où p(t), q(t) et b(t) sont des fonctions continues sur un même intervalle 1. La 


fonction b s'appelle le second membre de l'équation. L'équation 2” +p(t)x" + q{(t)x=0 
est l'équation homogène associée. 


Propriétés des solutions 


1)Soit x(t) une solution de l'équation homogène (h) x"+p(t)x'+q{t)}x = 0. Posons 

y(t) = Ax(t), où À est un nombre. On a 
g" + p(E)y" + ay = A" + pb) + x = (x + p(t}a' + q(t)x) = 0, 
donc la fonction y(t) est solution de (h). 

2) Supposons que xi(t) et x2(t) sont des solutions de (h). Alors la fonction 

y(t) = xi(t) + xo(t) est solution de (h), car 
J'+p (y +a(by = (a+ al +q(t}es) + (22+p(6) a+ q(t)2) = 0. 

3) Supposons que s(t) est une solution de l'équation (e) x"+p(t)x/+q(t}x = b(t). 
Pour qu'une fonction x(t) soit aussi une solution de (e), il faut et il suffit que 
l'on ait à” + p(t)æ' + q(t)x = 8" + p(t}s' + q(t}s, c'est-à-dire 

(æ—s)"+ p(#)(x—s) + q(t)(x—s) = 0, 
ce qui veut dire que u = x—s est solution de (h). Les solutions de (e) sont donc 
les fonctions x(t) = u(t) + s(t), où u(t) est solution de (h). 


Théorème 

a) Soient æ1(t) et xo(t) des solutions de l'équation homogène (h) x"+p(t)}x'+q(t}x = 0. 
— Pour tous nombres À, À, la fonction Aixi(t) + Aovo(t) est solution de (h). 
— Si les fonctions x, et x2 ne sont pas proportionnelles, alors les solutions de (h) sont 

les fonctions u(t) = Aixi(t) + Aoxo(t), où À1 et À2 sont des nombres quelconques. 

b) Supposons que s(t) est une solution de l'équation complète (e) x"+p(t)x'+q(t)x = b(t). 
Alors les solutions de (e) sont les fonctions u(t) + s(t), où u(t) est une solution 
quelconque de l'équation homogène (h). 


c) Soient to € TL et xo,vo des nombres quelconques. Il y a une unique solution s(t) de (e) 
satisfaisant les conditions initiales s(to) = to, 8/(to) = vo. 
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Pour résoudre l'équation (e), on cherche les solutions A1x1(t) + sxo(t) de l'équation 
homogène et une solution particulière de (e). On calcule ensuite les constantes Ài 
et 2 pour satisfaire les conditions initiales données. 


Il n’y a pas de méthode générale pour résoudre l'équation, mais on trouvera quelques 
techniques d'étude dans les exercices en fin de chapitre. 


Calcul d'une solution particulière. Supposons qu’on ait trouvé des solutions 
non proportionnelles u(t) et u(t) de l'équation homogène (h). Voici comment obtenir 
une solution particulière s de l'équation (e). 
i) On calcule la fonction w — uv! — u/v (elle ne s’annule pas), 
ület les fonctions À(t) — À md, ds et pi(t) = [ ee) ds 

to  w(s) to  w(s) 
Alors s(t)=A(t)u(t)+u(t)v(t) est une solution de (e) telle que s(to)=0 (voir page 493). 


Aspect vectoriel 


Si x et x2 sont solutions de (h), alors d’après les propriétés (1) et (2), il en va de 
même de la combinaison linéaire Àæ71+)2%. 
L'ensemble des solutions d'une équation linéaire homogène est un espace vectoriel. 
Pour toute fonction æx(t) deux fois dérivable sur 7, notons L(x) la fonction 
be a (t) + pr (Et) + q(t)r(t) 
On définit ainsi une application L':V — F, où V est l’espace vectoriel des fonc- 
tions deux fois dérivables sur l'intervalle J et F l’espace de toutes les fonctions. 
On dit que L est un opérateur différentiel. On a L(Xx) = AL(x) pour tout x € V et 
L(æ; + %9) = L(x1) + L(x2) pour tous x1 € V, 22 € V. 
L'opérateur L est une application linéaire. 


Par définition, une solution de (h) est une fonction x € V telle que L(x) = 0 : 
l'ensemble des solutions de (h) est donc le noyau de L (page 172). 

Traduisons la seconde affirmation (a) du théorème en notant S5 = Ker L l’espace 
vectoriel des solutions de (h) : si x1 et x2 sont des vecteurs de S, non colinéaires, 
alors tout vecteur x € Sÿ est combinaison linéaire de x, et x2; cela veut dire que 
(x1,x2) est une base de So. 


L'espace vectoriel des solutions de (h) est de dimension 2. 


Les solutions de (e) sont les fonctions x € V telles que L(x) = b. Supposons que s est 
une solution de l’équation (e). Pour toute fonction x € V, on a les équivalences 

L(x) = b L(x) = L(s) L(x—s)=0 
Cela exprime que les solutions de (e) sont les fonctions de la forme u +s, où u € So : 
c’est l'affirmation (b) du théorème. 
Soit { € . Notons S l’ensemble des solutions de (e) et définissons l'application 


C':S — R? qui à toute solution x(t) de (e) associe le couple C(x) = (x(to),x’(to)). 
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Pour tout (x0,v0) € R?, il y a une et une seule solution æ(t) ayant pour conditions 
initiales x(to) = to, t’(to) = vo. Pour l'application C, la fonction x(t) est donc l'unique 


antécédent de (xo,vo). Cela montre que l'application © est une bijection de S sur R?. 


Principe de superposition. Supposons que le second membre b(t) est une somme 
bi(t) + bi(t) de deux fonctions. 

Si si(t) est une solution de l'équation x"+p(t)x'+q(t}x = bi(t) et si so(t) est une solu- 
tion de l'équation x"+p(t)x'+q{(t)}x = bot), alors s1(t) + soft) est solution de l'équation 


2" +p(t}x'+q(t)x = bi(t) + bat). 


2.2 Équations linéaires à coefficients constants 
Il s'agit des équations différentielles de la forme 
(e) x" + px’ + qx = b(t) 
où p et q sont des nombres réels et b(t) une fonction continue sur un intervalle. 


Pour résoudre l'équation, il suffit, d’après les propriétés générales, de trouver une 
solution particulière s(t) et de résoudre l'équation homogène x" + px! + gx = 0. 


Résolution de l'équation homogène (h) x” + px’ + qx = 0 

Il est plus simple de chercher les solutions à valeurs complexes. Rappelons que pour 
dériver une fonction à valeurs complexes, on dérive sa partie réelle et sa partie ima- 
ginaire. Une telle fonction est donc solution si et seulement si sa partie réelle et sa 
partie imaginaire le sont (page 321). 

Rappelons aussi que si z= a+bi est un nombre complexe, on a posé e*t = elatbilt = 


e%(cosbt+isinbt), pour tout nombre réel #. La fonction tr e*! a pour dérivée ze’. 
Posons x(t)—e’t. Puisque x"(t)=2?e’t, il vient x”(t)+px'(t)+qx(t)=(22+pz+a)e’t. 


La fonction e** est solution de (h) si et seulement si le 
nombre z satisfait l'égalité 2? + pz + q = 0. 


Introduisons l'équation caractéristique 2? + pz + q = 0. 
Premier cas : p?—4q > 0. L'équation caractéristique a deux racines réelles dis- 


tinctes r et r2, d’où les solutions u1(t) = e"1* et u2(t) = e"?*. Ces fonctions n'étant 


pas proportionnelles, on en déduit d’après le théorème précédent : 


les solutions de (h) sont les fonctions Aet+ he!, où 
A et À sont des nombres réels quelconques. 
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Deuxième cas : p?—4q < O0. L'équation caractéristique a deux racines dis- 
tinctes conjuguées r +iw et Tr—1iw. 
Les fonctions (4) = e"teî”t et x(t) = e'te- 


en va de même des fonctions 


u(t) = (1/2)(x(t) + 7(4)) = e*coswt et u(t) = (1/2i)(x(t)—7(t)) = e"‘sinwt. 


iwt sont donc des solutions de (h) et il 


. u et w ne sont pas proportionnelles, on en déduit : 


les solutions de (h) sont les fonctions e"t(x coswt + À2 sinwt), 
où À1 et À sont des nombres réels quelconques. 


Troisième cas : p?—4q — 0. L'équation caractéristique a une racine double 
—p/2, ce qui fournit la solution réelle u,(t)—e”(P/2)t, Montrons que la fonction u2(t) = 
tui(t) est aussi une solution : on a en effet u,(t)=tu(t)+ui(t), up(t)=tu/(t)+2u (#6) et 


UE) + pui(e) + qua(t) = tul(#) + Qu (0) + ptui (0) + pu(t) + gt (t) 
= {ui (6) + pui (e) + qui(t)] + 2u1 (8) + puit) = 0 
car u1 est solution et u, — —(p/2)uw1. Puisque les solutions u1 et u2 ne sont pas 
proportionnelles, 


les solutions de (h) sont les fonctions (Ai + Xt)e-P/2t, où 
A1 et À sont des nombres réels quelconques. 


Comme nous n'avons pas démontré le théorème général du précédent paragraphe, 
vérifions que l’on obtient bien ainsi toutes les solutions. 

Dans l'équation (h), faisons le changement de fonction inconnue x(t) = e"ty(t), où 
r=-—p/2. Puisque +’(t)=(y/(t)+ry(t))e"t et x/(t)=(y"(t)+2ry/(t)+r?y(t))e't, il vient 
œ" (6) + pa (e) + qu(t) = [y” (6) + (2r + p}y' (6) + (r° + pr + a)y(b]e" 

On a 2r+p=0 et r? + pr + q = p?/4-p?/2 + q = —(p?—4q)/4. 

 Plaçons-nous dans le cas p?—4q>0 et ee a=(1/2)4/p?—4q. 11 vient r?+pr+q=—a? 
et æ”(t) +pæ'(t) + qu(t) = [y”(#) — a?y(t)]e"t. Ainsi la fonction z(t) est solution de (h) 
si et seulement si y(t) est solution de l'équation différentielle (x) y”—a?y = 0. 

Les fonctions yi(t) = e%* et y2(t) = e—%Ÿ sont évidemment solutions de (x). Soit y(t) 
une solution quelconque. 

Posons z(t) = [y/(t)—ay(t)]e®*. En dérivant, on obtient z/(t) = (y/’(t)-a?y(t))e®t = 
donc on a = c, une constante. Ainsi y/—ay = ce % et y est solution de l'équation 
différentielle y =ay+ce%*. Les solutions de l'équation homogène sont les fonctions \e%! 

Si a0, la fonction —(c/2a)e-*%* est une solution particulière, donc y(t)=Xett—(c/2a)e-*. 
Les solutions de (h) sont x(t) = e"ty(t) = AUTa)t_{c/2a)el"—4)!, où À et c sont des 
constantes quelconques. Puisque les nombres r + a sont les racines de l'équation carac- 


téristique, on obtient bien le résultat énoncé. 

Si a —0, c'est-à-dire p?—4q — 0, on a y —c, y(t) = ct+d, d'où x(t) = (ct+d)e"!, avec 
c et d des constantes. 

— Dans le cas p?—4q < 0, on a w = (1/2) /4q-p?, donc r? + pr +q=—(p?—4q)/4=w?. 
La fonction x(t) est solution de (h) si et seulement si y(t) est solution de l'équation 
différentielle y” + w?y = 0. 


CuariTRe 15 - ÉQUATIONS DIFFÉRENTIELLES - 453 


Posons z(t)=(y'(t)—iwy(t))e**t. En dérivant, on obtient z/(t)=(y/(t)+w?y(t))e**t=0, 
donc z(t)=c, une constante. Comme ci-dessus, y(t) est solution de l'équation différentielle 
du premier ordre (à coefficients complexes) y=iwy+ce**t, La fonction —(c/2iw)e- °*t 
est une solution particulière, d’où la solution générale : y(t) = aef“t—(c/2iw)e-*t, à 
et c étant des nombres complexes quelconques. Les solutions à valeurs réelles sont les 
A coswt + A2sinwt, où A1 et À2 sont réels, et en multipliant par e"t, on obtient les 
solutions de (h). 


Exemple : l'oscillateur libre 


On nomme ainsi les dispositifs physiques conduisant à une équation différentielle 
linéaire homogène d'ordre 2. En voici deux exemples (on note comme d’habitude à 
et # les dérivées par rapport au temps). 


nu 3 . - D 
1) Considérons une masse m suspendue à un ressort de raideur k. Si l'on Z 


écarte la masse de sa position d'équilibre (dans le sens vertical), son ol 
mouvement est régi par l'équation différentielle m% + ci + kx — 0, où c -à" 


est un coefficient d'amortissement (dû par exemple au frottement). 

2) Quand on laisse se décharger un condensateur de capacité C' dans une bobine 
d'inductance L et de résistance À, sa charge q(t) satisfait l'équation différentielle 
Lû + Rq + PL = 0 (l'intensité dans le circuit est q(t)). 

Décrivons le comportement des solutions en prenant l'exemple du pendule d’équation 

(R) mä + ct + kx = 0. L'équation caractéristique est m2? + cz + k = 0. 


Oscillations non amorties : © — O0. L'équation (h) s'écrit ë# + (k/m)x = 0 et 
les solutions sont les fonctions x(t) = À coswt + Xsinwt, où w — 4/k/m. On peut 
aussi écrire les solutions sous la forme 


z(t) = acos(wt — 4), en posant a = 4/X7 + À et tançg = X/M. 


Le mouvement est périodique, de période T = 2r/w : pour une 
masse donnée, la fréquence 1/T augmente avec la raideur k du ;, 
ressort. La figure montre des solutions pour un même dépla- 
cement initial x(0) = x, à partir de l'équilibre avec différentes 
vitesses initiales &(0) = vo, pente de la tangente en t = 0. 


Oscillations amorties : O0 < c? < 4mk. Les racines de l'équation caractéris- 
tique sont les nombres complexes —r +iw, où r =c/(2m) et w=(1/2m)V4mk — c?. 
Les solutions sont données par 


x(t) = ae"* cos(wt — y), où a > 0 et sont des constantes. 


Le mouvement consiste en des oscillations d’amplitudes de Ÿ 

plus en plus petites, les positions extrêmes étant limitées par T 

les fonctions +ae-"Ÿ qui tendent vers 0 quand t tend vers l 
+00 : la masse revient en oscillant vers sa position d'équilibre. 
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Amortissement fort : c? > 4mk. L'équation caractéristique a deux racines 
réelles r1, ra négatives (le produit r172 = k/m étant po- 7 

sitif, les racines ont le même signe, celui de leur somme 
r1+r2=-—c/m <0 : voir page 52). Les solutions sont données 
par æ(t) = Ae'tt + Xe"?t, La masse n’oscille pas, elle revient 
vers sa position d'équilibre x — 0 quand t tend vers l'infini. 


To 


Eh 4 


Amortissement critique : c? — 4mk. L'équation caractéristique a une racine 


double —c/2m et les solutions sont x(t) = e-#/2M{\t+ 2). x 
La masse n’oscille pas. Puisqu’une exponentielle n’est jamais x 
nulle, x(t) s’annule exactement une fois : dans l'intervalle de 1 
temps { > 0, la masse ne peut passer qu’au plus une fois par 
sa position d'équilibre. 
Dans certains circuits électroniques, les valeurs des composants sont calculées pour que 
le dispositif présente ce type de fonctionnement. 


Recherche d'une solution de l'équation complète 

Considérons un oscillateur mécanique sur lequel on fait agir une force variable f(t), 
ou bien un circuit résistance-capacité-inductance alimenté par un générateur de tension 
variable ÆE(t). La réponse x(t) à l'excitation est solution d’une équation différentielle 
à + pt + qæx = b(t) de second membre b(t) — f(t) ou b(t) — Et) selon le cas. 

Pour trouver une solution particulière, on peut utiliser la formule générale donnée 
page 451. Mais plaçons-nous dans le cas fréquent d’un second membre de la forme 


A(t) cos at ou bien A(t)sinat, avec À une fonction polynôme. 
On cherche alors directement une solution particulière 
s(t) = U(t) cos at + V(t) sin at, où U et V sont des polynômes 
- de même degré que À si ia n'est pas racine de l'équation caractéristique 
2 +pz+a=0, 
- de degré 1 + deg À si à a est racine de l'équation caractéristique. 


Cas non amorti. Cherchons une solution de l'équation différentielle # + w?r — 
Ecosat (E constant) sous la forme s(t) = U(t)cosat+V(t)sinat, où U et V sont 
des polynômes. L'équation caractéristique 2? + w? — 0 a pour racines +iw. 


Supposons à £ +w. Les polynômes U et V sont alors des constantes. En posant 
81(t) = U cos at et s2(t) = V'sin at, il vient 


81(4)+w?s1(t) = —aUcosat+w?U cosat , 32(t)+w?s2(t) =—aVsinat+w?Vsinat 
La fonction s(t) est solution si et seulement si l’on a 


(w?— a )U cos at + (w?—a?)V sin at = Ecosat quel que soit t. 
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et s(t) = rs, 

2 W —& 
La solution générale acos(wt — )+s(t) de l'équation est la superposition de deux 
régimes périodiques de fréquences w/27 (la fréquence propre) et a/27 (la fréquence 
d'excitation). 

Supposons a? — w?.On cherche simplement un polynôme U(t) — ut sans terme 
constant, car cos œt est solution de l'équation homogène. En posant s(t) = utsinat, 


il vient $(t) = usin at+aut cos at et 


En identifiant, on obtient V — 0, U — 2 
Œ —® 


2 


8(t) + w?s(t) = 2ua cos at—uo”t sin at + W?ut sin at = 2uacos at, car w? = . 


La fonction s(t) est donc solution si et seulement si 2ua — E, d’où la solution 
s(t) = a E. 

Cette solution particulière n’est pas bornée, elle présente des 
oscillations d’amplitudes croissantes, limitées par les droites 
de pente +(1/2a) issues de l’origine. On dit que l'excitation 
E coswt provoque la résonance de l’oscillateur. 


Phénomène de battement. Supposons à Z w, mais & et w peu différents. La 
solution de conditions initiales x(0) = &(0) = 0 est 


a+w)t a—w)t 
z(t) = —E ; [coswt — cos at] = 2 ; [sin (ou sin 
a —w œ—w 2 2 
: : — .… (a-w)t æ 
Puisque |a — w| est petit, la période de sin est grande : 
les oscillations de x(t) sont lentement modulées en amplitude. t 


Cas des oscillations amorties. Cherchons une solution particulière s(t) de l’équa- 
tion du pendule mi+ct + kx = E cos at, où les nombres positifs k, c et m vérifient 
0 < c? < 4mk. En posant s(t) = U cos at + V sin at et en identifiant dans l'équation, 
(k—-mo)U + caV =E 


—CaU +(k-ma)V = 0 et la solution 


on obtient le système linéaire { 


E(k-ma) : Eca 
(k-ma) +2 (k-ma?} + 
On a st) = F'cos(at — 6), où F = VU? +V?=- 2 est l'amplitude 


— 22 2,42 
maximale de la fonction 5. (k—ma?)? + a 


Quand t tend vers +, chaque solution de l'équation homogène tend vers 0 comme 
une fonction e "?. Il s'ensuit que la réponse de l’oscillateur est rapidement très 
voisine de s(t). Cette réponse est périodique, de même période que l'excitation, 
mais déphasée de w, où tan = V/U = ca/(k—-ma?). Faisons varier la fréquence 
d’excitation et cherchons le comportement de l'amplitude F. 

Supposons & > (. 


Comme fonction de à, F varie dans le sens contraire de (k—ma?)? +c?a?. La dérivée 
_. a donc le signe de -+ [(&-ma?) + 0] = -2a[(c—-2mk)+2m° |. 
[82 197 
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= Si c? > 2mk, la fonction F(a) est décroissante. 

Supposons 0 < c? < 2mk. Alors Fa) est maximum pour une pp 
certaine valeur a telle que 2m°aè = 2mk—c?. Le quotient F/E 

est un gain d'amplitude entre l'excitation et la réponse : s’il est 
supérieur à 1, l’oscillateur fonctionne en amplificateur. 1 


Sur la figure, nous avons porté le gain en ordonnée et « en 

abscisse. Chaque courbe montre les variations du gain pour une 1 a 
valeur donnée de c; le gain maximum est d'autant plus grand que c est plus petit. 
Quand le coefficient d'amortissement c tend vers 0, le gain maximum tend vers l’in- 
fini et & tend vers /k/m qui est la fréquence d’excitation provoquant la résonance 
dans l'équation mà + kx = 0 (page 456). 


Application : franchissement d'une marche de potentiel 


Considérons le mouvement rectiligne d’une particule d'énergie constante Æ dans un 
champ de potentiel V(x), où x représente l’abscisse sur la trajectoire. En Mécanique 
quantique, sa fonction d’onde p(æ)e-{*t doit (dans un état stationnaire) vérifier 
do 
dx? 


l'équation différentielle + : (E—V)9 = 0, où h est la constante de Planck et 


m la masse de la particule. 
Prenons le potentiel V défini par V(x) = 0 si x <0, V(x) = VW si x > 0, et suppo- 
sons W > 0 : on dit que c’est une « marche de potentiel » ; cette fonction discontinue 
en 0 modélise un potentiel physique (en pointillé sur la figure) 
qui varie continûment de O0 à V, sur un très petit intervalle de 
longueur négligeable devant la longueur d'onde de la particule. 
L'équation différentielle s'écrit 


2 

À - + 2mE — 0 dans le domaine x < 0 

dx h 
2 2m(E-V 

- _ LE me v) w$—=0 dans le domaine x > 0 
me 


Cas E > V, : réflexion partielle. En Mécanique classique, une particule d'énergie 
E franchit toujours une marche de potentiel W, < E. Nous allons voir que, dans 
le cadre de la Mécanique quantique, l'onde associée a une probabilité non nulle 
d'être réfléchie. 

Posons k, = V2mE/h et ki — /2m(E-V;)/h. Sous forme complexe, la solution 
s'écrit | 

_. 0 ER 

po(x) = apei#® Lane tt si x > 0 

On doit calculer les constantes pour raccorder 41 et w2 en x = 0 de sorte que le 
résultat soit continu et dérivable en ce point (puisque V(x) n’est pas continu en 
x — 0, l'équation différentielle montre que les solutions ne peuvent pas avoir de 
dérivée seconde en ce point). 
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Derrière la barrière de potentiel, il n’y a pas de particule progressant dans le sens 
des abscisses décroissantes, donc a, = 0 : il n’y a qu’une seule onde transmise. Les 
conditions de raccordement w1(0)=4%2(0) et w1(0) =4%%(0) s'écrivent a; +a = a2 et 
k1(a1—a,) = k2a2. Puisque la solution n’est déterminée qu’à un facteur multiplicatif 
près, introduisons les rapports r = aï/ai et À = a2/a. Il vient 
À-r —L ki —ko 2k: 
a MES Es et nn 
Il existe donc des solutions ae"? définies pour æ > 0, autrement dit l’onde 
incidente peut franchir la marche de potentiel. 
Dans la fonction 41, la partie aie**® correspond à une onde progressant dans 
le sens x croissant avec une probabilité de présence uniforme proportionnelle à 
lae° HER correspond à une onde dans sens opposé, de pro- 


=? ; la partie ge ‘he 
2 
! 
“2 : 2 Mon: a _ 
babilité de présence a!” : le taux de réflexion est R= a . Le taux de transmission est 
ai 


évidemment T=1-—R, car il est certain que la particule est transmise ou réfléchie. 
k1—k2) Akk& Ak1k 

alert = —— et donc T= ——"—. 

(k1 + ka) (k1 + ka) (k1 + ka) 


Puisque les rapports r = a /ai et À = a2/a: sont réels, la réflexion et la transmission 
se font sans déphasage. Si est très gran ar rapport à , alors k: et k2 son 

font déphasage. Si E est très grand p pport à Vo, alors k: et k t 
proches, T est voisin de 1 et la particule est presque sûrement transmise. 


Cas E < Vs : réflexion totale. En Mécanique classique, la particule ne peut pas 
franchir la marche de potentiel : elle est réfléchie. Voyons ce qu'il en est dans le 
cadre quantique. 

On pose cette fois p2 = /2m{(V5—E)/h et l’on a go(x) = baeP2® + be P2#, pour 
x > 0. La solution doit rester bornée quand x tend vers +, donc b2 — 0. Les 
conditions de raccordement s’écrivent 


a ki+ipo 1.  ki+2p2 
172 ; 
: : [ml _|ki-ip:] se: : 
et le taux de réflexion est À = 1. Comme en Mécanique classique, 
ai ki+ip2 


l'onde est donc réfléchie et puisque le terme a! /a1 n’est pas réel, l'onde réfléchie 
est déphasée par rapport à l’onde incidente. Cependant, la solution réelle be” P2? 
définie pour x > 0, montre que la particule a une probabilité non nulle d'exister au 
delà de la marche de potentiel, contrairement au cas classique. L’onde transmise 
est qualifiée d’évanescente, car be ??? tend vers 0 quand x tend vers +co. 


2.3 Conditions aux bords 
Pour déterminer une solution d’une équation différentielle du second ordre, nous 
avons jusqu’à présent utilisé des conditions initiales æ(to) = 0, x’ (to) = vo portant sur 
la valeur de la solution et de sa dérivée à un instant { donné (théorème page 450). 
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Mais dans de nombreux problèmes, on cherche plutôt une solution prenant des va- 
leurs données 9 et x1 à des instants to et t1 donnés. Ces conditions s’écrivent 
a(to) = to, t(t1) = 21, avec to £ 1 ; comme on impose les valeurs de la solution aux 
extrémités de l'intervalle [to,t1], on dit que ce sont des conditions aux bords. 

Nous allons voir que le problème n’a pas toujours de solution. 


Exemple. L'équation différentielle x” +w?r = 0 (avec w 4 0) a pour solutions 
x(t) = acoswt + bsinwt. Les solutions telles que x(0) = x sont les fonctions 


a(t) = to coswt + bsinwt 


Donnons-nous un instant t, 0 et une valeur +1. La condition x(t1) = x s'écrit 

æocoswt+bsinwt,=T, ce qui permet de calculer b si wt; n’est pas multiple entier de x. 

Supposons t1 = r/w, donc x(f1) = ro coswti = —xo. 

Si 21 £ —%0, il n’y a aucune solution vérifiant les conditions x(0) = 0, æ(t1) = «1. 

> Si 1 = —%0, il y a une infinité de solutions telle que x(0) = 0, x(t1) = æ1 : ce 
sont toutes les fonctions x(t) = x coswt + bsinuwt, où b est quelconque. 


Pour une équation différentielle linéaire à coefficients constants, on sait trouver toutes 
les solutions : il est donc possible de chercher s’il y a une solution vérifiant des 
conditions données aux bords, et de la calculer. 


Cas d'une équation à coefficients variables 


Abordons le problème des conditions aux bords pour une équation différentielle à 
coefficients variables : 


(©) a+ poal + qe = bd), 2) = 20, eh) = 


Tir au but. Considérons les solutions de l'équation différentielle qui prennent la 
valeur x, en to. On sait que chacune d’elles est déterminée par sa pente initiale 
x/(to). En notant s4(t) la solution telle que 5, (0) = k, le problème est de trouver la 
valeur de k pour que sx(t1) = 1. 

Pour résoudre numériquement le problème (c), on emploie d'habitude la technique 
du «tir au but». 


— Par balayage, on cherche d’abord une pente initiale k pour laquelle s4(t1) n’est 
pas trop différent de x1. 

— Si par exemple sz(t1) < x1, on fait varier À par petits pas dans le sens qui fait 
augmenter la valeur 54(t1). Quand sz(ft1) a dépassé la valeur x1, on fait évoluer 
k dans l’autre sens en employant un pas plus petit, et l’on itère ce processus 
d’approximations successives. s 


tir trop haut! 


Bien entendu, on doit disposer d’une méthode numérique a, Cûr trop hau : 


pour calculer la valeur en t de la solution s; de conditions : tir trop bas 
initiales s4(t0) = x, 5, (to) = k (voir page 518). “LA 


| 
| 
to ü 


_u 
t 
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Un résultat général 

Soit u(t) la solution de l'équation (e) x" + p(t}x' + q(t}x = b(t) telle que u(to) = x0 
et u/(to) = 0. 

Soit v(t) la solution de l'équation homogène (h) x" + p(t}x' + q(t)x = 0 telle que 
u(to) = 0 et v'(to) = 1. 

Si v(t1) 0, la fonction x(t) = u(t) + 


x —u(t1) 


u(t) 


conditions aux bords x(to) = xo, (ti) = æ1. 


v(t) est solution de (e) et satisfait les 


Démonstration. La fonction u(t) est une solution de (e) et Au(t) est solution de (h) pour 
toute constante À, donc x({) est solution de (e). De plus, on a &(to) =u(to)+0=%0 et x(t1) = 
d1—u(t1) 


u(ti)+ u(t) 


u(t1)=u(ti)+21-u(t1)=271, donc x(t) satisfait bien les conditions aux bords. 8 


3. L'équation de Newton 


En Mécanique, on considère souvent des mouvements dont l'accélération n’est fonc- 
tion que de la position : c'est le cas, par exemple, pour une masse oscillant sans 
amortissement au bout d’un ressort (page 454). Étudions l'équation différentielle 
générale de ce type de mouvement. 


Définition 
Une équation de Newton est une équation différentielle de la forme x” = f(x), où 
jf est une fonction continue sur un intervalle. 


Résolution 
On commence par chercher s’il y a des équilibres, c'est-à-dire des solutions x(t) 
constantes. 


Si a est un nombre tel que f(a) = 0, alors la fonction constante x(t) = a est solution, 
car æ’(t) = x”(t) = 0 = f(x(t)) quel que soit £. Réciproquement, pour qu’une fonction 
constante æ(t) = a soit solution, il faut que l’on ait 0 = x”(t) = f(x(t)) = f(a). 


Les valeurs d'équilibre sont les nombres a tels que f(a) = 0 : 
la fonction constante de valeur a est solution. 


Si a est une valeur d'équilibre, la solution de conditions initiales x(to) = a,æ'(to) = 0 
est la fonction constante de valeur a. Une fois trouvés les équilibres, on résout 


l'équation dans un domaine ne contenant pas d'équilibre. 
Première étape. En multipliant par x’, l'équation s'écrit 2/1” = f(x)x’. 
Posons vw = x’ et soit F une primitive de f. 


On a 1 d (y?) = vv = xx" et L [F(x(t))] = f(x(t))x' (0) = x” (6)x'(#), donc 


2 dt 
2) = & LFGE)] 


460 L'ÉQUATION DE NEWTON 


© Dunod -— La photocopie non autorisée est un délit. 


Donnons-nous des conditions initiales x(to) = x0 et (to) — vo. En intégrant de to 
à t l'égalité précédente, il vient 
1 1 

(D Lo? — Lu = F(2) — F(x0) 
L'égalité (1) s'appelle une intégrale première de l'équation, car elle ne fait plus 
intervenir que la dérivée première v = 2’. 

Seconde étape. On résout l'intégrale première. L'égalité (1) s'écrit en effet x? — 
2F (x) — 2F(x0o) + vê, ou encore 


(2) = +/2F(x) — 2F(x0) + và 


C'est une équation différentielle autonome du premier ordre (page 447) dont il 
faut calculer la solution de condition initiale x(to) = x. 


L'exemple du pendule 


Faisons osciller une masse m suspendue en un point © par une tige non pesante de 
longueur {. On suppose que le mouvement se fait dans un plan vertical passant par ©. 


| 


Considérons un axe Oz dirigé vers le bas par un vecteur unitaire ü et o {sinx 
appelons x l'angle que fait la tige avec cet axe. 
La masse est soumise à son poids mguü dont le moment de rappel par 


rapport à O est .#{ = —mglsinx. Le moment d'inertie de la masse par 
rapport à O étant 1 =m?, le mouvement est régi par l'équation .# = 1ï. 
Après simplification par m{, cette égalité s'écrit —gsinx = Là, c’est-à-dire 
(e) à = —(g/l)sinx ÿ 


C'est une équation de Newton, avec f(x) = —(g/l)sinx. Remarquons qu’elle ne 
dépend pas de la masse du pendule. 

Les valeurs d'équilibre sont les ax — kT, où k est un nombre entier quelconque. II 
y a deux positions d'équilibre : pour les valeurs 0,27T,..., le pendule est en posi- 
tion verticale basse; pour les valeurs x,3T,..., il est en position verticale haute. Si 
l’on place le pendule dans l’une de ces positions et qu’on l’abandonne sans vitesse 
initiale, il reste en équilibre. 

Supposons qu'on écarte le pendule d’un angle x, et qu’on le lâche avec une vitesse 
angulaire initiale vo. 


Calcul de l'intégrale première. En prenant cosx comme primitive de —sinx, 
l'intégrale première est v?—vÿ = 2(g/£) cos x—2(g/£) cos xo, ou encore 
v?—2(g/£) cos x = vÿ—2(g/£) cos to 
À l'instant initial, la vitesse de la masse est {uo, donc son énergie cinétique est 
Fi Lmtèug. La hauteur de la masse par rapport au point O est —-{cosxo, donc la 
différence d'énergie potentielle par rapport à ce point est E, — —mgl cos xo. L'énergie 
totale est U = E+E, = m£? [vè-(g/0) cos %o| = ml?K5. Puisque le système n’est 


soumis qu’à la pesanteur, la loi de conservation de l'énergie (page 425) affirme que U 
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reste constante au cours du mouvement : c’est précisément ce qu’exprime l'intégrale 
première, sous la forme v?—2(9/£) cos x = 2K5. 


D'après l'intégrale première, la solution x(t) de conditions initiales +(0)=x0, &(0)=v0 
2 
est déterminée par &? = 2(g/£) cos x + 2Ko, où Ko = (9/2) COS T0. 


En posant Lo — (L/g)Ko, cette équation différentielle s'écrit 
(1) m(0)=z20 ,; à —2(g/£)(Lo + cosx) 
Son domaine est formé des (f,x) tels que Ly+cosx >0.Si Lo2>1, alors on a Ly+cosx >0 


pour tout + et le domaine est l’ensemble de tous les couples (t,x).Si —-1<£Lo<1, alors x 
doit rester dans les intervalles où cost >—£Lo. On a toujours Lo—(£/g)Ko>—costo>—1. 


Le plan des phases. Repérons le mouvement de la masse par sa position x et sa 
vitesse angulaire à — v. Portons x en abscisse et v en ordonnée : on obtient le plan des 
phases. À tout instant t, l’état du pendule correspond à un point M(t) = (x(t),v(t)) 
dans le plan des phases. 

Le mouvement est donc représenté par une courbe paramétrée dans ce plan. Pour 
un point initial Mo = M(0) donné, l’ensemble des points M(t), tER, s'appelle la 
trajectoire de M. 

Dans le demi-plan supérieur, on a & = v > 0, donc la trajectoire est parcourue dans 


le sens x croissant; dans le demi-plan inférieur, la trajectoire v _ 

est parcourue dans le sens x décroissant. D'après l'intégrale ANA 

première, le point A{(t) est toujours sur la courbe C d’équation - 
v? = 2(g/£)(Lo + cos x) VANAVV 


Étude des trajectoires dans le plan des phases. On part du graphe de cosz ; 
en translatant l’axe des x de la quantité —Z, le long de l’axe des ordonnées, on 
obtient le graphe de Li+ cos x. Pour dessiner la courbe C, étudions la fonction 


h(x) = 4/2g/£ V/Lo+cosx. 

La courbe C n’est définie que pour les valeurs de x où l’on a L6+cosx >0. Procédons 

comme page 275. 

Cas Lo > 1.On a Lo+cosx > 0 pour tout x, donc À est définie sur R, h(x) est 
strictement positif et varie comme cos x. Puisque v(x) = +h(x), C est la réunion 
du graphe de À (courbe C:) et du graphe de —h (courbe C_), deux courbes sans 
point commun (figure 1). 


Supposons vw > 0. Le point initial M = (xo,v0) est donc sur la courbe C'} située 
dans le demi-plan v > 0 et M(t) parcourt C} dans le sens x croissant. De plus, 
t(t) reste supérieur ou égal au nombre positif 4/(2g/£)(Lo—1), donc x(t) tend 
vers +00 quand { tend vers + : la trajectoire est la courbe C, tout entière. 
La vitesse est maximum pour x = 2kr (passage du pendule en position basse) 
et minimum pour æ = (2k+1)r. Pour le pendule, il s’agit d’un mouvement 
tournoyant autour du point d'attache O. 
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Lo+ cos x 


figure 1 


Si vo < 0, on obtient le mouvement en sens inverse : la trajectoire est la courbe 
C_ située dans le demi-plan v < 0, parcourue dans le sens x décroissant. 


Ces mouvements ne peuvent exister qu'à un niveau d'énergie suffisant et avec une 


vitesse initiale v, non nulle. 


Cas —1 < Lo < 1. Il y a un nombre à € ]0,7| tel que cos a = —Z4. Puisqu’on a 
cosx >cosa si —-a<x<a, la fonction h(x) est définie sur ]—[-«, a] et aussi sur les 
intervalles qui s’en déduisent par translation de 27. Sur 1, h(x) varie comme cosx 
et s’annule en a et en —a avec une tangente verticale (page 276). Pour avoir la par- 
tie Co de C' située entre les abscisses —a et a, on complète le graphe de h en faisant 
la symétrie par rapport à l’axe des abscisses, ce qui donne une courbe fermée (fi- 
gure 2). La fonction cosinus étant paire, C9 est aussi symétrique par rapport à l'axe 
des ordonnées. La courbe C est formée de C5 et de toutes ses translatées de 2kr. 


MA 00000 — 


Pour décrire le mouvement, on peut supposer x entre —T et 7 : le point initial 


(to, vo) étant sur Co, M(t) parcourt le cycle C5 indéfiniment. Le sens est celui 
des x croissants quand M{(t) se trouve dans le demi-plan v > 0, et celui des x 
décroissants quand le point est dans le demi-plan v < 0. L'angle x et la vitesse 
v sont périodiques : le mouvement consiste en des oscillations d'amplitude «a 
autour de la position d'équilibre basse. 


Cas Lo — 1. Pour —-7 <x<7, on a h(x) = /2g/{VT +cosx = 21/g/l cos(x/2), 
car 1 + cos x = 2(cos(x/2))” et . > 0. 
Sur [-7,x], on a h'(x) = —\/g/lsin(x/2) : en x, h a une demi-tangente de pente 


g/l, et en —T, h a une demi-tangente de pente opposée Va/£. On en déduit 
le graphe de h et, par symétrie, la courbe C' (figure 3). 
La différence par rapport au cas précédent, c’est que les points d'équilibre A=(—7.0) 
et B—(x,0) sont sur C. Notons T* la partie de C' située dans le demi-plan v > 0 
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et T° la partie située dans le demi-plan v < 0. 


ANNAY mn 
TE AAA 


Si le point initial est À, c’est-à-dire 9 — —7 et vo = 0, la trajectoire est réduite 
au point À : le pendule reste dans sa position d'équilibre haute ; de même si le 
point initial est en B, la trajectoire est réduite au point B. 


1+ cos x 


-— Supposons que le point initial M, est sur T*, autrement dit —7 <xo<x et vo >0. 
La trajectoire est alors tout l'arc AB de T*, extrémités non comprises, parcouru 
de À vers B. Le point M(t) met un temps infini pour parcourir l'arc MoB. 

Si l’on a —7 < x < 7 et vo < 0, le point initial est sur T et la trajectoire est 
l'arc BÂ de T-, extrémités non comprises, parcouru de B vers À. 

Il y a donc quatre trajectoires entre —7 et 7 : les deux points À et B et les arcs T* 

et T7. 
Cas Lo — —1. Puisque —-1+cos x n’est positif ou nul que pour x = 2kn, où k est 
un entier, l’ensemble C' n’est constitué que des points d'équilibre bas (2kx,0), 


chacun d'eux étant une trajectoire. 


La figure ci-dessous montre l’ensemble des trajectoires. 


eve: 


Pour déterminer la fonction x(t), il faudrait résoudre l'équation différentielle (1) 
page 462. En écrivant — = +./29/0 dt, il vient 


/ Lo+ cos x 


æ(t) 
(2) [l du = + t 
zo  VLo+cosu £ 


Mais l'intégrale ne se calcule pas au moyen des fonctions usuelles. 


Stabilité des équilibres 

- L'équilibre bas x9 = vo = 0 est stable : si Mo est proche de l’origine, la trajectoire 
est un petit cycle autour de l'origine, correspondant aux petites oscillations du 
pendule autour de son équilibre bas. 
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- L'équilibre haut 0 =+ÆT,vo —0 est instable : en effet, si Mo est proche de B—(x,0) 
mais différent de B, le point M(t) parcourt une trajectoire qui l’éloigne loin de 
B ; c'est ce qui se passe si l’on abandonne le pendule sans vitesse initiale à partir 
d’une position angulaire x voisine de 7x mais différente de 7 (figure 2 avec «a 


proche de Tr), ou bien si, à partir de la position æ9 = ET, on lui donne une vitesse 
initiale v non nulle (figure 1). 


Étude des petites oscillations sans vitesse initiale. Supposons qu’on lâche 
le pendule sans vitesse initiale (vo — 0) après l’avoir écarté d’un angle x, tel que 
0 < X0 <T. 

En posant Valt= w, on a alors Ko =—w?cosxo et Lo = —cosx0. Pendant la première 
demi-oscillation, on a —x0 < x(t) < ro, &(t) < 0 et l'équation (2) devient 


(3) dœ = -2wdt 
COS T— COS To 


Supposons xo petit. 
Remplaçons cosæ par son développement limité 1—x?/2 en 0 et de même pour 


: -: d 
cos 9. On obtient 0 = dt, et en posant x = xoy, il vient 1, =. jé, 
x3—x? 1—y? 
0 
En intégrant, on a Arcsiny = —-wt+c, d'où y = sin(—wt + c); la constante c est 


déterminée par y—1 quand t—0, donc 1=sinc, c—7/2 et y—sin(—-wt+7/2)=cosut. 
Finalement, quand x, est très petit, les oscillations sont approximativement décrites 
par la fonction 


z(t) = xo coswt 
La période est T5 = 27/w = 2r/{/g, mdépendante de la petite amplitude x. 


En réalité, la période T dépend de x,. Pour en faire une meilleure estimation, revenons 
à l'égalité (3). Le temps mis par le pendule pour aller de xo à 0 est un quart de 
période, donc d’après (3), on a 


T _ fr dr 
2 _—_ 
Var = f 


(cos T— COS zo) 


1/2 
Cette intégrale généralisée est bien définie, comme nous l'avons montré page 327. 
Puisque cos x— cos 0 = 2sin?(x0/2) — 2sin?(x/2), il vient 


Tryo À PT dx 
47 v2 l [sin? (0/2) sin? (x/2)]°/? 


ou encore 


r À #0 dx 
5 L [sin?(x0/2)- sin?(x/2)] 


Puisque x reste inférieur à %0, faisons le changement de variable sin(x/2)=sin(x0/2)sing. 
On a 


1/2 


1 T 7, _ g TO 
9 COS dx = sin 9 cos © d@p 
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T = 


To 


T [” 2sin(x0/2) cos do 
0 cos(x/2)[sin?(xo/2)—sin*(xo/2) sin? y 


Fe 


_ 2[" sin(æ0/2) cos ç dy 
7 "Jo  cos(x/2)sin(ro/2) cosy 


Loft 2 fT “e 
FA o  cos(x/2) 0 [1- sin?(x0/2) sin? |] Li 


Puisque x, est petit, remplaçons la fraction par son développement limité : 


r T és JL: 2 
Î [1 + 3 sin (to/2) sin el dp 


r/2 x? 
D | É + TL cos 26)| dy, car sin(xo/2) © xo/2 
0 


nm [+ | Te, car [77? cos 2 dy = 0 


2 
On trouve finalement que la période est T = Ti (: + “) quand x, est petit. 


Introduction au calcul des variations 


De nombreux problèmes conduisent à chercher une fonction y(x) qui rende maxi- 


mum (ou minimum) une quantité de la forme J(y) = LF(&u() y () dx, où 
l'expression sous le signe intégrale dépend de x, de la fonction y et de sa dérivée 
y'. L'intégrale J(y) s'appelle une fonctionnelle de y. 

En général, la fonction inconnue y doit satisfaire des conditions supplémentaires, 
comme prendre des valeurs données en x = a et en x =b (conditions aux extrémités). 


Exemple. La vitesse de la lumière dans un matériau d'indice optique n est c/n, où 
c est la vitesse de la lumière dans le vide. D’après le principe de Fermat, un rayon 
lumineux suit le chemin le plus rapide. Pour un déplacement suivant une courbe 
y(x) dans la direction x croissant, un élément d’arc de longueur ds — 4/1 + y”? est 


parcouru à la vitesse c/n(x), où n(x) est l'indice du milieu à l’abscisse x. On a 
donc _ = C et le temps mis par la lumière pour aller d’un point A d’abscisse 
nr 


a à un point B d’abscisse b est l'intégrale de cdt, c’est-à-dire la fonctionnelle 


b 
= 1 | n(x) V1 + y? dx 
C Ja 


Enoncé du problème. Pour clarifier la notation, introduisons une variable p pour 
désigner la dérivée y. Considérons une fonction F(x,y,p) de trois variables et la 
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fonctionnelle 


b 
I) = [l F(æ,y(x),#/(x)) de 


Les fonctions admissibles. Donnons-nous des points À = (a,yA) et B = (b,yg) : 
on dira qu’une fonction y(x), dérivable jusqu'à un ordre suffisant, est admissible si 
l'on a y(a) = ya et y(b) = yp, autrement dit si le graphe de la fonction y(x) a pour 
extrémités les points À et B. 
Dans le cas où l’on veut rendre maximum la fonctionnelle J(y), le problème se 
formule ainsi : 

trouver une fonction f(x) admissible telle que J(f) > J(y) pour 

toute fonction admissible y. 


Variation d'une fonctionnelle. Puisque y est une fonction, un accroissement h 
à la fonction y est une fonction h(x) (suffisamment de fois dé- y 
rivable) telle que la fonction (y + h)(x) = y(x) + h(x) est encore i 
admissible, ce qui revient à supposer h(a) — h(b) — 0. 


Si l’on ajoute deux accroissements ou si l’on multiplie un ac- s- 
a b x 


croissement par un nombre réel, ces conditions aux extrémités 
sont encore vérifiées : l’ensemble des accroissements est donc un espace vectoriel de 
fonctions. Afin de mesurer la taille d’un accroissement h, définissons sa norme 


_— ! 
VAI = max, AG) +] 


Pour cette norme, un accroissement h est petit si toutes ses valeurs h(x), ainsi que les 
valeurs de sa dérivée h’(x), sont petites. 


Supposons qu'on peut écrire 
J(y+h)—J(y) = L(h) + p(h) 
où L,(h) dépend linéairement de h et w(h) € I] (donc w(h) est négligeable de- 
0 


vant |h|| quand À tend vers 0, voir page 265). Pour un accroissement h assez petit, 
la fonctionnelle L,(h) ne diffère de la différence J(y + h) — J(y) que d'une quantité 
négligeable devant ||h||. 

La fonctionnelle linéaire L,(h) s'appelle la variation de J en y. 


La variation d’une fonctionnelle est l’analogue de la différentielle ordinaire d’une fonc- 
tion. Comme pour la différentielle, nous allons voir que si J/(y) présente un extremum 
en y = f, alors sa variation en f est nulle. 


Condition nécessaire d'extremum. Soit f une fonction admissible. Si la fonction- 
nelle J(y) présente un extremum local en y = f, alors Ly(h) — 0 pour tout accroissement 
h tel que h(a) = h(b) = 0. 


Démonstration. Supposons par exemple que J(y) a un maximum local en y = f, donc 
J(f+h)—J(f)<0 pour tout h assez petit. Pour montrer que L}=0, raisonnons par l’absurde 
en supposant qu’il y a un accroissement h; tel que L/(ho) Æ 0. Puisque J(f + ho) — J(f) ne 
diffère de L;(ho) que d’une quantité négligeable devant ||ho||, on en déduit, si la norme de 


CuarirRe 15 - ÉQUATIONS DIFFÉRENTIELLES - 467 


ho est assez petite, que J(f + ho) — J(f) et L(ho) sont tous deux négatifs. Mais puisque 
Ly(h) dépend linéairement de h, on a aussi L(—ho) =—L;(ho) > 0 et comme L(—ho) doit 
avoir aussi le signe de J(f — ho) — J(f) < 0, cela est impossible. = 


4.1 L'équation d'Euler 


Traduisons cette condition dans le cas de la fonctionnelle 


b 
J{) = | F(&,y(x),y(x)) de 


où la fonction F(x,y,p) a des dérivées partielles secondes continues. Rappelons que 
les fonctions admissibles y sont les fonctions deux fois dérivables telles que y(a) = yA 
et y(b) = ys sont des valeurs données. 


Théorème. Pour que J(y) ait un extremum en y = f, il faut que 


2E (of) P) — À JE (ef) '()] =0 
L'égalité ci-dessus s'appelle l'équation d'Euler. 


Démonstration. Pour un accroissement h tel que h(a) = h(b) —0, on a 
b 
Jo+ 70) = [ [Fev + hu +h)— Fun] de 


Écrivons l’approximation affine de F(x,y,p) au point (x,y,y') : 


Fa, y+ h,y +) — F(x,y,y) = na y)+ n'OE (3:91) + (h) 


où d’après le choix de la norme de h, 4(h) est négligeable devant |h|. On en déduit que la 
variation de J en y est 


b 
Lu) = | (DE (auto) 1 (0) + WE (au). v/(0))| de 


Si J(y) a un extremum local en f, alors L;(h) =0 pour tout accroissement À deux 


fois dérivable tel que ha) = h(b) = 0. Posons pour simplifier a(x) = _ (x, f(x), f'(x)) et 
y 
B(x) = _ (x, f(x), f'(æ)), de sorte que 


b 
(1) À [a(x)h(x) + B(x)h'(x)] dx = 0 , si h(a) = R(b) = 0. 


En posant A(x) = J a(t) dt et en intégrant par parties, il vient 


a 


[ a(x)h(x) dx = — [ A(x)h'(x) dx, 


car h(a) = h(b) = 0. La condition (1) devient 


b b 
(2) L [-A(x) + 8(x)]n'(x) dx = | u(æ)h'(æ) dx = 0 , où u(x) = —A(x) + A(x). 
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u(x) dx et choisissons l'accroissement h(x) = | À [u(t) — c] dt. On a bien 
b b 
h(a) = 0 et A(b) = | [u(t) — c] dt = / u(t) dt — c(b—a) = 0. De plus, 


b 


b 
| [u(æ)—c]h'(x) dx u(æ)h' (x) dx — c[h(b)—h(a)] = 0, d’après (2). 


b 
Or h'(x) = u(x) — c, donc il vient | Lu(x)-d” dx = 0. Puisque la fonction Lu(x)-d” est 
continue et à valeurs positives ou nulles, on en déduit qu’elle est nulle (page 288). On a 
donc u(x) = c pour tout x € [ab]. 


Ainsi, nous avons montré que f(x)—A(x) est constante, d’où G'(x) = A'(x) = a(x) pour tout 
æ entre a et b : c'est l'équation d’Euler. ü 


Exemple. Reprenons l'exemple précédent d’un rayon lumineux se propageant du 
point À = (a,yA) au point B = (b,yg) dans un milieu d'indice variable n(x). Pour 
trouver la courbe y(x) décrite par ce rayon, on doit minimiser la fonctionnelle J(y) = 


b 
| n(x)4/1 + y'(x)? dx. Posons donc F{x,y,p}=n(x)4/1 + p°.L'équation d’Euler s'écrit 


o=2F, 007 2 (22e ): cé OP 9 


0y 0x 0p 0x \/1+p oy 
! 

y)n(x) = K , où K est une constante. 
1+7y(x)? 
K 


Il vient y’ = , c qui ramène le calcul de y(x) à celui d’une primitive. 


n(x)? — K2 
La solution générale dépend de deux constantes, K° et la constante d'intégration dans 
la primitive : on les détermine au moyen des conditions y(a) = yA et y(b) = ys. 


En introduisant l’abscisse curviligne ds= 4/1 + y?dx (page 313), on a n(x) a =kK É ; 
“n LT 


d — 
donc n(x)dy = K ds et n(x) . = X. Notons T° le vecteur tangent unitaire à la courbe 


y(x) et 0 l'angle Or, T. Puisque # = sin 0, il vient 


n(x)sin(8(x)) = K 


On obtient ainsi la «loi de la réfraction » : considérons une droite d’équation x = x; 
l'indice y est constant; puisque la normale à la droite est dans la direction de l’axe 
des x, au point où il traverse cette droite, le rayon fait 
l'angle 45 = 8(xo) avec la normale; la loi de la réfraction 
affirme que pour deux points d’abscisses 29 et 71, on a 
no Sin 60 = 1 sin #1, où no et n1 sont les indices et 46, 6: 
les angles que fait le rayon avec la normale aux lignes (ou 


plus généralement aux surfaces) d'indice constant. 
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Cas particulier où F' ne dépend pas de x 
b 
Supposons que la fonctionnelle est J(y) — | F(y, y) dx. On a alors 
: 2 2 
d b ya) = [2 », 0F n OF AE Fois OP 


dx Op 0y y + Op y Op Ôp? ARS Oyôp ” 
ou encore 
d :0F OE,r. OF,» OF,n,r 
(x) dx |F 2e 0y y Oyôp” Op? Li 


Dans l'équation d’Euler, l'expression est 


0F _ 0 (9F 0F _9 {oF\dp, 9 (9F\dy _9Fr __&F,, Ep 
Oy  Ox | Op Oy Op\ôp) dx 0y | p}) dx Oy  Oydp Op? 


et en multipliant par y’, on obtient (x). 


L'équation d’Euler s'écrit donc L LF y! 2e = 0 et les solutions sont les fonctions 
TX 
J telles que É 


F(f(x), f'(x)) - (a) LE (F0). J'(x)) =c, où c est une constante. 
D 

4.2 Application : une stratégie de croissance végétale 
Une plante partage ses ressources énergétiques entre croissance, reproduction et dé- 
fense. Pour simplifier, considérons seulement le cas d’une plante qui, à tout âge t, 
consacre une partie c(t) de ses ressources à sa croissance et le reste à la reproduction ; 
on a bien sûr 0 < c(t) <1 pour tout { z 0. 
La valeur reproductive de la plante est 


(1) h= | abet)dt, où 


— (t) est la quantité de graines produite à l’âge t, 

— q(t) est la probabilité que la plante atteigne l’âge t. 

Voici une modélisation qui se propose de calculer la fonction c(t). 

Le facteur fécondité. Dans une espèce végétale, la fécondité dépend de l’âge : pour 
des individus pouvant atteindre une taille suffisante, la production moyenne de 
graines croît structurellement avec la taille (comme dans le cas d’un arbre, par 
exemple). Si l’on note f(t) la fécondité, nous écrivons donc cette production sous 


la forme a(f ()°, où « et Ë sont des constantes allométriques positives. 


Variation de la fécondité. Le taux de fécondité de la plante est le nombre dé- 
rivé f'(t) : faisons l'hypothèse qu'il est proportionnel à la croissance et à l'écart 
fm — f(t), où fn est la fécondité correspondant à la taille maximum. 

On a donc 


J'(E) = a[fm — f(t)]c(t) , où a est un facteur positif propre à l'espèce. 
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C'est une équation différentielle linéaire. La constante f,, est solution particulière 
et puisqu'on doit avoir f(0) = 0, il vient 


(2) Î() = fm[1 - e-400)] , avec C(t) = | c(s) ds. 


Evaluation de la production de graines. Considérons que pour un individu donné, 
la quantité de graines produite est proportionnelle à la part de ressources consacrée 


à sa reproduction. Puisque la plante ne consacre à sa reproduction qu’une partie 
1— c(t) de ses ressources, adoptons pour la fonction w(t) la formule 


(3) et) = [1 ct)Ja(f(0)° 


Introduisons le taux de mortalité u(t) à l’âge t et la probabilité q(t) pour que la 
plante atteigne l’âge t. Entre des instants rapprochés + et t+ôt, les plantes meurent en 
proportion q(t) — q(t+ôt) = u(t)q(t)ôt, d'où l'équation différentielle g'(t) = —u(t)q(t). 
Puisque qg(0) = 1, la solution est 


(4) q(t)=e MO , avec M(t) = | 0 ds. 
0 


En tenant compte des égalités (2), (3) et (4), la valeur reproductive [1] est ainsi 


Rat [MO — 620008 [1 — cf] dé 


On considère que la plante répartit ses ressources de manière à rendre maximum la 
valeur À. Puisque c(t) = C’(t), introduisons la fonctionnelle 


JO= [ME - #01 — C'(O] à 


Pour découvrir la stratégie employée par la plante, il s’agit de trouver une fonction 
C(t), définie pour t>0, à dérivée c(t) =C"(t) comprise entre 0 et 1 et telle que J(C) 
est maximum. Bien qu’on ne soit pas exactement dans le cadre théorique précédent 
(car l'intégrale est généralisée), écrivons néanmoins l'équation d’Euler, en prenant la 
fonction 

F(t,C,p) = e MOT el" (1-p), 


où p représente la variable c = C”. L'équation d’Euler est Re 0, avec 
D 
OF _ ,-M -aCT8-1, ac 
D @8[1-e-40] ae (1 — 0) 
OF ___,-M -aC16 
> En — —€ (a) [1 6 ] 


= Or u(t}e- M [1 - e-201F er pi [1 - e"40]F ace 20 
et il vient après simplification 


0 — e MO Bae-*C®) [1 _ e AA n u(t}e ME [1 - ea )e 
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aC(t) u(t) + Ba 


On en déduit Bae-2C(® — j(#)[1 — e-400] = 0, où encore € Œ et 
finalement É 
1 Ga 
D C(t) = - In 1 + 2e 
6) @= Lu |1+ 2 


La fonction C(t) est la quantité totale de ressources que la plante a affectée à sa 
croissance jusqu'à l’âge t. 

On considère habituellement qu'avant d'atteindre un âge # de maturité reproductive, 
la plante consacre toutes ses ressources à sa croissance afin d'atteindre au plus vite 
sa période de reproduction : on a donc c(t) = 1 pour t < to et par suite C(t) =t 
pour t < to. Ainsi, la solution C(t) est en réalité définie en deux morceaux : 


t ROSES 
CG) = Linfi+ fe si t > Lo 
ut) 
L'instant to est l’âge de première reproduction : il satisfait l'équation t5— lin ! + T j | ; 
a H\to 


car C est une fonction continue. La figure 1 montre l’allure d’une courbe C(t) ty- 
pique. Sur la figure 2, on voit la dérivée c(t) — C'(t) sur chaque intervalle : c’est la 
proportion des ressources que la plante affecte à chaque instant à sa croissance. 


figure 1 figure 2 


to t to t 


a Exercices mms 


@ 1. Associer chaque équation différentielle à son champ de directions. 


a x'=r À b) x —t— 2x d zx =te 


A 
NZ 


Ro 
rs 


figure 3 figure 4 


@ 2. Forme normale d'une équation linéaire du second ordre. Soit l'équation différentielle 
(1) x” +p(t)x! + q(t)x = 0, où p(t) et q(t) sont des fonctions. 
a) Montrer que par le changement d’inconnue x(t) — z(t)a(t), l'équation (1) devient 
az” + (2a! + pa)z + (a” + pa! + qa)z = 0. 


Dj rt 
b) Posons a(t) — exp Eee j p(s) ds]. Montrer que l’on a a(t) > 0 pour tout # et que 
0 
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@ 3. 


@ 4. 


@ 5. 


! 2 
z est solution de l'équation différentielle linéaire (2) 2 + (q— _. À) = 0 où la 
dérivée première de z ne figure plus. 
c) Utiliser cette transformation pour résoudre l'équation x” + 2tx' + t?x = 0 (on se 
ramène à 2/ — z — (). 


Le wronskien. Soit l'équation différentielle (1) x”+p(t)x! + q(t)x —0, où p(t) et q(t) 
sont des fonctions. Si x(t) et y(t) sont des solutions de (1), leur wronskien est la 
fonction w = xy — x'y. 
a) Montrer que w'=zxy"—x"y et que w'+pw —0. En déduire que w(t) — 
t 
w(to) exp [-— Î. p(s) ds]. 


On peut ainsi, directement à partir de l'équation différentielle (1), calculer le wronskien 
de deux solutions à un facteur multiplicatif près. 


! 
b) Supposons que J est un intervalle où æ(t) ne s’annule pas. Montrer que (2) = 
t w(s) 
ds. 
x(s)? 


Si l’on connaît une solution x, cette formule fournit une solution y non proportionnelle à x. 


et que pour & et t dans 1, on a y(t) — a(e) | 


« Appliquons ce qui précède à l'équation de Bessel (bo) x” + nd + x = 0 dont une 
solution est la fonction Ji(t) définie dans l’exercice 8 page 394. Montrer que si a et 5 
sont deux zéros consécutifs et de même signe de Jo, alors entre à et 3 les solutions 


de (bo) sont les fonctions cJo(t) + dJo(t) l 


ds ;, où cet d sont des constantes. 
sJo(s) 


Un exemple d'utilisation du wronskien. Supposons que x(t) est une solution de l’équa- 

tion de Bessel (bo) : tx” + x" + tx = 0 et que xt) est définie en t = 0. 

a) Montrer que le wronskien w = x/J5 — xJ( est défini au voisinage de t = 0 et so- 
lution de l'équation tw' + w = 0. Résoudre cette équation et en déduire que l’on 
a w(t) = 0 pour tout t. 


b) Montrer que ei — 0. En déduire que l’on a x(t) = x(0)Ji(t) quel que soit t. 
0 


Pour l'équation (bo), les seules solutions définies en { = 0 sont donc les fonctions cJ6, où 
c est une constante. 


Équations oscillantes. On considère l’équation différentielle x” + q(t)x — 0 et l’on 

suppose qu'il existe un nombre w > 0 tel que, pour tout t, q(t) > w?. 

Soit {y un nombre réel; on pose #1 = to + - et S(t) = sin[w(t—to)|. 

Nous allons voir que si q(t) est définie sur l'intervalle [to,t:1], alors toutes les so- 

lutions x(t) de l'équation différentielle x” + q(t)x = 0 s’annulent au moins une fois 

dans l'intervalle [to, ti]. 

a) Posons w = 2'S—xS". Montrer que w'(t) = S(t)x(t)[w?—aq({t)]. 

b) Supposons x(t) >0 pour to <t<t1. Montrer qu’alors on a w(to) <0, w(t1) >0 et que 
w est décroissante sur [to,t1]. En déduire une contradiction et le résultat annoncé. 
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c) Supposons que l’on a q(t) > w? sur un intervalle 1 de longueur au moins T/w. 
Montrer qu’alors chaque solution de (1) s’annule au moins une fois dans tout 
intervalle J inclus dans I et de longueur m/w. Si par exemple I = ]-00,+oc![ ou 
bien 7 — ]a,+{, alors chaque solution a une infinité de zéros dans I : on dit 
que l’équation différentielle (1) est oscillante. 


L'équation +” +w?x=0 a pour solutions les fonctions sin(wt +4) qui oscillent d'au- 
tant plus vite que w est grand. Le résultat précédent montre que dans l’équation (1), 
plus q(t) est grand, plus les solutions oscillent vite. 


d) On a esquissé page 158 le graphe d’une solution de l'équation d’Airy x”+tx=0 : que 
peut-on dire de la courbe dans le domaine t > 0 ? (voir aussi l'exercice 7 page 572) 


. L'équation de Bessel générale. Étant donné un nombre réel à, l'équation de Bessel 
2 
d'indice & est (b,) : æ"+ 4 + (-S) x = 0, définie dans l'intervalle ]0, +co|. 


Posons x(t) = y(t)/V#. 
: 12 : 11 o— (1/ 4) 
a) Montrer que y(t) est solution de l'équation y” + OR y. 
b) En appliquant l'exercice précédent, montrer que toutes les solutions de (b,) sont 
oscillantes dans ]0,+00|{ et que si |a| < 1/2, alors chaque solution de (b,) s’annule 
au moins une fois dans tout intervalle de longueur . 


Le graphe de la solution J de (bo) est montré page 394. Les valeurs des premiers 
zéros positifs des fonctions J, et J, — —J} sont données page 577. 


«) Résoudre l'équation de Bessel pour a = 1/2. 


L'équation de Bessel intervient dans de nombreuses questions de Physique, notam- 
ment dans l'étude des vibrations d’une membrane de tambour. En appelant r,0 les 
coordonnées polaires dans le plan de la membrane et z(r,0,t) l'élévation à l’ins- 
tant { du point de coordonnées (7,0), les solutions fondamentales sont de la forme 
z = sin(wt)sin(nô)u(r), où n est un entier positif. La fonction u(r) doit vérifier 


2 

l'équation u'” + Ly + [uw?e? — n) u = 0, où c est un coefficient qui dépend des 
r 

unités, de la tension de la membrane et de son élasticité. Il est facile de voir qu'en 

posant v(wcr) = u(r), la fonction v est solution de l'équation de Bessel (b,). Il faut 

que « soit définie en r = 0, ce qui impose u(0) = 0, et si a est le rayon de la 

membrane, on doit avoir u(a) = 0 : il s'ensuit que pour n fixé, w doit être l’un des 


nombres 21/ca,...,2k/Ca,..., Où 21,...,2k... sont les zéros de vw. 


. Équation linéaire du second ordre où l'on connaît une solution de l'équation homogène 
Soit l'équation différentielle (1) x” + p(t)x! + q(t)x = b(t), où p(t), q(t) et b(t) 
sont des fonctions. Supposons que u(t) est une solution de l'équation homogène 
(h) x” + p(t)x! + q(t)}x = 0 et cherchons une fonction À(t) non constante telle que 
v(t) = X(t)u(t) soit solution de (1). 

Montrer que v” + pu + qu’ = u\” + (pu + 2u')\ + (u” + pu! + qu) À. En déduire que 
v(t) est solution si et seulement si la fonction z — N\’ est solution de l’équation du 
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@ 2. 


premier ordre uz! + (pu +2u/)z = b(t). On sait que cette dernière équation se résout 
au moyen de primitives. 


Longues vagues dans un estuaire. Considérons un estuaire y 
de longueur a s’ouvrant sur la mer. Prenons un axe Ox 
comme sur la figure ci-contre, l’origine étant au fond de 
l'estuaire. La largeur b de l'estuaire et sa profondeur 
h sont des fonctions de x. Par rapport au niveau 2 7 | 
de la surface au repos, l'élévation de l’eau dans 
l'estuaire, à l’abscisse x et à l'instant t{, est une  ———<--—-—- 

dy _ 9 0 
ot? b Ox 
les écarts de pression dûs aux accélérations verticales des particules liquides). 


À l'embouchure (x = a), il se maintient une houle périodique C'cos(wt+4), de sorte 
que l'équation devient ( 


9 9 2 
TL — | hb— y = 0. 
b Üx oh) + ay 


Supposons la profondeur h constante et la largeur b proportionnelle à x. 


fonction y(x,t) solution de l'équation (nb 2) (à condition de négliger 


0y 


a) Montrer que y(x,t)=2(x)cos{wt+(,), où z est solution de l’équation z”+ Lux, 
TX 


avec k = w/\/gh. 


Jo(k 
b) En utilisant l'exercice 4, montrer que y(x,t) = C Li) 


Jo(ka) 

c) En se reportant au graphique de l'exercice 8 page 394, expliquer pourquoi dans 
l'estuaire, l'amplitude des vagues augmente au fur et à mesure qu’elles remon- 
tent depuis l'embouchure, alors que la distance entre deux crêtes successives reste 
presque constante. 


cos(wt+). 


Expansion d'une bulle de gaz. Une bulle de gaz sphérique immergée dans un fluide 
subit une expansion sous l'effet de sa pression interne p. Soit ro le rayon initial 


N 


et p; la pression interne à l'instant { — 0. Supposons que la pression ambiante est 


ro N\ 37 
négligeable devant p et que l'expansion suit la loi adiabatique P = () , Où 7 est 
Di r 
l’exposant caractéristique du gaz. Notons p la masse volumique du fluide et r(t) le 
rayon de la bulle à l'instant t. En faisant l'hypothèse #0 à £=0, r satisfait l'équation 
| 37 
(1) ré + 38 @() 
2 r 
où €? = p; /p (e coefficient c est homogène à une vitesse). 


DRE 2, , d (,3,2 d (207 3-3 
a) En multipliant (1) par r‘#, montrer que l’on a 2 (r F ) = + Ro Je 


2 3 3 
b) En déduire l'intégrale première 3 — D 12) (2) 1 , 


c) Prenons +—4/3 (valeur convenable pour un gaz diatomique) et posons r=rp(1+2). 
Montrer que l’on a (1+2)?2 = 22. En déduire 4/22 (1 + 22 + L2) = 24; 
To : 


To 
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d) Supposons par exemple que le diamètre initial de la bulle est 1 mètre et sa 
pression initiale de 10° atmosphères (une atmosphère vaut à peu près 10 hPa). 
Montrer que, dans l’eau, le rayon de la bulle double en 1/250 seconde environ 
et est multiplié par 5 en 1/30 seconde environ. 


Ce modèle est utilisé aussi bien en Astrophysique que dans le cas de l'explosion d’une 
mine sous-marine ou dans les dispositifs de sécurité pour la soudure à l’arc en plongée. 


10. Surface de révolution d'aire minimum. Parmi toutes les 
courbes y(x) joignant deux points À = (a,ya) et (b,yg), 
cherchons celle qui engendre une surface d’aire minimum 
quand on la fait tourner autour de l’axe Ox. 


Pour une courbe située dans le demi-plan y > 0, l'aire 


b 
en question est J(y) — 2x | yv/1+y"°? dx. Supposons que 
y(x) est une solution du problème. 


a) En remarquant que F(y,p)=y4/1+p? ne dépend pas de 
x, montrer que l'équation d’Euler conduit à la relation y/1+y"°? — y’ _. 

1 

où c est une constante. L+y 


yy' 


b)En déduire que l’on a y(x) = c/1+y°?. En supposant ys > yA, montrer que 
’ lar2 — 2 
y=1 = et z+d= cm ?* , 
c 


c 
c) Montrer que si l’on pose u — L(y+ V/y?—c?), alors . = (y V/y?—c). En dé- 
duire y(x) = : (etre ere) 5 ch Be où ch est la fonction cosinus 

€ 


hyperbolique (page 268). 


On doit choisir les constantes de manière que y(a) = yA et y(b) = y. Si ces condi- 
tions déterminent c et d de manière unique, alors le problème a une seule solution. 
S'il n’y a pas de constantes c et d possibles, il n’y a pas de solution. 


2 


2 _y3, 


@ 11. Une équation autonome. Soit l'équation différentielle (x) 2x! = x 
a) Quelles sont les solutions constantes ? 


b) Quel est le sens de variation de la solution telle que x(0) — 1/2? Quel est son 
intervalle de définition ? Quelles sont ses limites aux bornes de cet intervalle ? 


cd Soit s la solution de (x) telle que 5(0) = 2. Quelle est la relation entre s(t) et # ? 


(trouver un polynôme U de degré 1 et un nombre p _ que _ + _ = Re 
_. : : s(£ 4 _ 1 
et utiliser la méthode page 323 : la relation est In | D t+In2 51 


d) Montrer que l'intervalle de définition de s est de la forme Ja, +oo| et calculer le 
nombre a. Montrer que s est décroissante et que Jim s(t) = 1. 
—++00 
1 


V2(t-a) 


e) Montrer que s{t) + quand + tend vers a (utiliser (c)). 
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Chapitre 16 


Systèmes différentiels 


Quand les variations d’une quantité x dépendent de sa valeur, son comportement 
est régi par une équation différentielle x’ — f(t,x). Lorsque plusieurs quantités x, 
y sont en jeu et que chacune influe aussi sur le taux de variation de l’autre, les 


1 Q 
équations sont de la forme { . = f(tx,y) 
y = g(t,x,y) 


système différentiel. Une solution est constituée de deux fonctions x(t), y(t) vérifiant 
2(0 = f(bx(6, 0) et (0 = g(t,r(t),y(#)) pour tout +. 


, où f et g sont des fonctions : c'est un 


Exemple : proies et prédateurs. En l'absence de prédateurs, une espèce animale 

(A) se reproduit a un taux proportionnel au nombre d'individus (loi de Malthus) : 

cela veut dire que si x est le nombre d'individus à un certain instant +, la vitesse + 

d’accroissement de population est ax, où a est une constante positive. La fonction x(t) 

est solution de l'équation différentielle ax : si x9 est le nombre d'individus à l'instant 

t= 0, la solution xoe%* croît exponentiellement vers l'infini, ce qui n’est pas réaliste. 

Supposons que l'espèce (A) est soumise à des prédateurs (P) en nombre y(t) et 

faisons des hypothèses vraisemblables sur le comportement de ces populations. 

i La mortalité chez (A) due à la prédation est de la forme bxy, proportionnelle au 
nombre xy de contacts entre les individus. 

ü Le taux de croissance des prédateurs est proportionnel à leur nombre y et à la 
quantité de proies, donc de la forme dxy, où d est une constante. 

ï) La surpopulation des prédateurs est évitée grâce à un taux de mortalité cy pro- 
portionnel à leur nombre (autolimitation due à la compétition pour la nourriture). 


Cela conduit au système différentiel suivant : 


ee qe , où les constantes a, b,c,d sont positives. 
ÿ = —cy + dry 


Système différentiel autonome. Dans l'exemple précédent, le système diffé- 


jp 
rentiel s'écrit (e = . , où les expressions f(x,y) et g(x.y) ne dépendent pas 
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de t : on dit que le système est autonome. Plus généralement, un système différentiel 
est autonome si la relation entre fonctions et dérivées y est indépendante du temps. 


Comment rendre autonome un système différentiel 
Considérons par exemple le système non autonome 


RE Cet 
(1) { 7 = (2,9) 

y = g(t,x,y) 
En plus des variables d'état x et y, introduisons une nouvelle variable d'état Tr et 
considérons le système différentiel 


T 1 
(2) z'=f 

= g("?,y) 
C'est un système autonome à trois fonctions inconnues T(t), x(t) et y(t). La pre- 
mière équation donne r(t) =t+c, où c est une constante. Si l’on résout (2) avec 
la condition initiale r(to) — to, alors on a r(t) —t quel que soit t et les fonctions 
x(t) et y(t) sont solutions de (1). Tout système différentiel peut de cette façon se 
ramener à un système autonome de taille un de plus. 


Systèmes différentiels linéaires 


Exemple 1. Dans le dispositif représenté ci-contre, les masses m1,m2 sont fixées à 
1: 2 
des supports par l'intermédiaire de ressorts r1,r3 et reliées entre-elles 
| 3 
par le ressort r2; l’ensemble est mobile verticalement. Repérons la 


position des masses le long d’un axe vertical en appelant %1,2%2 L mu Lx 
7 ù _ PR z | 1 1 
l'écart de chacune par rapport à sa position d'équilibre. Les équations ;, 
différentielles du mouvement sont m2 +} x 
T3 
(1) mi Ë1 — —k1T: + ka(x2—x1) 
mMoËo = —ko(r2—ti) — k3to 


où k1,ko,k3 sont les raideurs des ressorts. En posant vi — 1 et vi — %2, ce système 
devient 


1 = V] 
2 = V2 
d = —[(H+k)/m]m + (ko/mi)2 


d2 = (k2/mo)ai — [(k2-+ks)/mo] 2 


Une solution (x1(t),x2(t),vi(t), vo(t)) est représenté par un point mobile dans l'es- 
pace des quatre coordonnées (1,12, 1,2) ; cet espace, appelé l’espace des phases du 
système, est de dimension 4. Une solution définit une courbe paramétrée, donc une 


æ1(t 
æo(t 
vi(t 
vo(t 


trajectoire, dans l’espace des phases. Introduisons le vecteur X(t) = et rap- 
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pelons que le vecteur dérivé X(t) s'obtient en dérivant coordonnée par coordonnée. 


En utilisant la notation matricielle, le système différentiel ci-dessus s'écrit 


(té 0 0 10 di(t 
do(t) | 0 0 OT) at ou encore 
di t —(k1+k2)/ma ki/m 0 0 v1(É 
vo(t ki/mo —(k2+k3)/mo 0 0 AU 
0 0 1 0 
; 0 0 O1 
(S) X = AX 4 avec À — —(ki+k2)/mi k2/mi 0 0 
k2/me —(ko+k3)/mo 0 0 


La matrice À s'appelle la matrice du système. Le système différentiel (1) est d’ordre 
2, car il fait intervenir des dérivées secondes, mais le système différentiel (S), de 


taille 4, ne comporte plus que des dérivées premières. 


Exemple 2. En Économie, on distingue deux types de taux d'intérêt : un taux 
à court terme c et un taux à long terme {. Tout changement de valeur pour l’un 
des taux a une répercussion sur l’autre. Voici un modèle simple pour les variations 
conjointes de c et { au cours du temps : 


LUE D ouencr [f] = [73 2] [;]+ [5] 


Les constantes r.,a,b sont positives : a et b sont des vitesses d'évolution pour les 
9 1 


taux cet {; r s'interprète comme la valeur limite de c+{ (exercice 1). Introduisons 


le vecteur d'état X(t) = FAI la matrice À — | + du système et le vecteur 
ar 


constant B — | |: Le système s'écrit X — AX + B et le vecteur B s'appelle le 


second membre du système. 


Exemple 3. Le butène, un corps chimique de formule C4Hs, se présente sous trois 
formes isomères B1, B2, B3, correspondant à différentes dispositions des atomes 


dans la molécule. 


butène-1: CH: —CH— CH —CH3 


cis-butène-2 trans-butène-2 
CH; CH H CH 
K / D du 
C—C C—C 
À “ # à 
H CH: H 
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Ces trois formes coexistent et s’échangent au cours de réactions équilibrées, les 
concentrations [B1]|, [B2], [B2:] variant au cours du temps selon les équations suivantes : 


diBil = —(k1,2+k1,3)[B1] + k21[B2] + k31[B3] 


aiB D 
B ÿ 
= k1,2[B1] — (ko,1+k2,3)[B2] + k3,2[B3] A 
ko 
2 3 


1 


$ 
; : 


d[B3] B 


= ki 3[B1] + ko,3[Bo2] — (k31+k5,2)[B3l] k 


dt n 
où les nombres positifs k; ; sont constants à température et pression données. En intro- 
[Bi] 
duisant le vecteur d'état X = | [B2] | et la matrice du système, les équations s’écrivent 
[Ba] 
ax —k12—k1,3 ko 1 k3 1 
— AX , où A= k12 —k21—k23 k3,2 à 
ki,3 ko 3 —k31—k3,9 
L : À - De 5 Lu d[B1] . 
es proportions dans le mélange évoluent vers un équilibre caractérisé par D — 
d|B d|B : 
es = ei = (0. Remarquons que la somme [B:1] + [B2] + [B3] des concentrations 
d d d 
est constante, car en ajoutant les lignes du système, il vient er + Éd + 1 = 0. 


Dans les exemples précédents, les systèmes différentiels introduits sont de la forme 


2h = ut + @279 +: + Qintn + bi(t) 
Th = QT + Q22T9 + *** + GonEn + ba(t) 


x, = Gn121 + An2292 +" + AnnEn + bat) 


où les coefficients a;; sont des constantes et où b1(t),...,b,(t) sont des fonctions. 
En posant 
T1 Qi @12 ** Gin b1(t) 
To G21 92 °°° An bi(t) 
X= |. , A=!|. . et Bt) — ; 
Ln An1i n2 ‘Ann b(t) 


le système s'écrit X/ = AX + B(t). 


Définitions 

Un système différentiel de la forme X’— AX + B(t), où À est une matrice carrée 
à coefficients constants et où B(t) est un vecteur de fonctions, s'appelle un système 
différentiel linéaire à coefficients constants. La matrice À est la matrice du système et la 
fonction t-— B(t) est le second membre. Si B(t) =0 quel que soit t, le système est dit 
homogène. Le système différentiel X’ = AX s'appelle le système homogène associé. 
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Une solution du système différentiel X’— AX + B(t) est une fonction X(t) à valeurs 

vectorielles telle que X’(t) = AX(t) + B(t) pour tout £. 

— Supposons que X,(t) et X2(t) sont des solutions du système différentiel homogène 
X'— AX et formons la combinaison linéaire Y (4) = a X1(t) + a2X2(t), où «1,2 
sont des nombres. Alors on a X{(t)— AX;(t), X;(t) = AXa(t) et en ajoutant il vient 

x — œX! + a2X, = GAX; + aAX9 — A(aX: + o2X2) = AY 


Pour un système différentiel linéaire homogène X'— AX, toute 
combinaison linéaire de solutions est encore solution. 
Supposons que S(t) est une solution du système différentiel X’ = AX + B(t). 
Puisque S’(t) — AS(t) + B(t), une fonction X(t) est solution si et seulement si 
X'-—5S'={(AX + B(t)) - (AS + B(t)) > (X -S) = AX — AS = A(X — S) 


Ainsi, pour que X(t) soit solution de X’ = AX + B(t), il faut et il suffit que la 
fonction X(t) — S(t) soit solution du système homogène associé. 


Propriétés générales des solutions 

Pour le système homogène X’ — AX : {a fonction nulle est solution et toute combi- 
naison linéaire de solutions est solution; l'ensemble des solutions est un espace vectoriel. 

Pour le système complet X’ — AX + Bt) :si S(t) est une solution de X' = 
AX + B(t), alors toutes les solutions sont de la forme X(t) = Xo(t) + S(t), où Xo(t) 
est une solution quelconque du système homogène X' = AX. 
La différence de deux solutions est donc une solution du système homogène. 


Pour résoudre le système différentiel, il faut en trouver une solution particulière et 
résoudre le système homogène associé. 


1.1 Résolution du système homogène X’ — AX 


Exemple 1. Prenons À = É le Le système différentiel X' = AX s'écrit 


d\ = aTi 

{ œ) = bm 
La première équation est une équation différentielle de la seule fonction inconnue x:1. 
Les solutions sont æ1(t) = kie%t, où k1 est une constante quelconque. De même, les 


solutions de la seconde équation sont les fonctions x2(t) — koett, où k2 est quelconque. 
Les solutions du système sont les fonctions 


kie* et 0 ol 

X(t) = = 

( ) be | 0 ebt ko 

où k, et k2 sont des constantes. On a X(0) — Êdr c'est-à-dire æ1(0) = k1 et 


x2(0) — k2 : la solution est donc entièrement déterminée par sa valeur en t — 0. 
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Exemple 2. Posons À = É : |: Le système différentiel X' = AX s'écrit 


Ti = AT + pr? 
{ ds = 

Commençons par la seconde équation qui n’a qu’une fonction inconnue. Ses solutions 

sont x2(t)=k2e%", où k2 est quelconque. En reportant dans la première équation, il vient 


(+) x, = ar + pkoe* 
une équation du premier ordre avec second membre. La solution générale de l’équa- 
tion homogène est ke*!. Cherchons une solution particulière de (*) sous la forme 


s(t) = c(t)e“!, conformément à la méthode de variation de la constante (page 444). 
En reportant s(t) dans (+), il vient 


ac(t}e%Ÿ + c'(t}eŸ = ac(t}e%* + pkie* 
et après simplification, on obtient c(t) = pk2, dont une solution est c(t) = pkot. 


La fonction s(t) = phkote®Ÿ est donc une solution de (+). On en déduit que les solutions 
de (*) sont les fonctions 


rit) = kie% + kopte® , où k1 est une constante quelconque. 


Finalement, les solutions de X’ — AX sont les fonctions 


kie%Ÿ + kopte? eŸ ptet E 
X t — + 
( ) | koeît 0 ect ko 


où k1 et ki sont des constantes. On a X(0) — ba donc X(t) est déterminée par 
sa valeur en { — 0. | 

Ces exemples montrent que si la matrice À est diagonale ou triangulaire, le système se 
résout en prenant les équations une à une : on commence par l'équation qui ne contient 
qu'une inconnue et l’on substitue les solutions dans les autres, de proche en proche. 
Pour résoudre un système homogène général, nous allons nous ramener au cas d’une 
matrice diagonale ou triangulaire. 

Faisons un changement d’inconnue en posant X = PY, où P est une matrice carrée 
à coefficients constants. On suppose P inversible, de manière à pouvoir exprimer 
Y = P-1X au moyen de X. 

Chaque coefficient x;(t) de X(t) est une combinaison piyi(t) +poyo(t) ++: -+paun(t), 
où [P1 P2 -:: Pa] est la i-ème ligne de P. On a x/(t)=piyi(t)+poys(t) ++. -+pau,(t), 
donc X’(t) = PY'(t). Il vient 


X'= AX PY' = APY V'=P APT 


Pour que la fonction X(t) = PY(t) soit solution de X'— AX, il faut et 
il suffit que Y(t) soit solution du système différentiel Y' = (P7'AP)Y. 
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Méthode de résolution 
On utilise la technique de diagonalisation ou de trigonalisation expliquée pages 176 
à 182. Distinguons plusieurs cas. 


À est diagonalisable avec des valeurs propres réelles. On calcule les va- 

leurs propres À1,...,), de À et les vecteurs propres associés V1, V2,..., Va. 

Puisque À est diagonalisable, les vecteurs propres forment une base de l’espace 
vectoriel R”, la matrice P dont les colonnes sont V.,...,V, est inversible et la ma- 
trice P-!AP est la matrice diagonale D = diag(\;,,2,...,À,) dont les coefficients 
sont À1,À2,..., An. 


Posons X = PY. Les solutions du système différentiel Y’ = DY sont 


ke*it et Q ... 0 ki 
koe*2t 0 e2t 0 ko 
Y(t) = = . 
ki kernt 0 O :.. ent kn 
où K= |: est un vecteur constant quelconque. Pour trouver les solutions du 
kn 
système X’ = AX, on doit effectuer le produit matriciel X = PY ; calculons 
eñt 0... 0 
(Ba. 0 
R(t) = É Ve v …__ . [= fetiy ext, ... ehiy, 
0 O :.. ent 
Puisque P = [Vi -.: V,], en multipliant à droite par le vecteur X, on obtient 
X(t) = PY(t) = R(E)K = ke Vi + he, +... + khetriy, 
où k1,...,k, sont des nombres quelconques. 
Les solutions e{V,...,e\r{V, s'appellent des solutions propres : ce sont les colonnes 


de la matrice R(t). 
La solution générale est une combinaison linéaire des solutions propres. Puisque les 
vecteurs propres V; sont indépendants, les solutions propres sont indépendantes. 
Les solutions propres forment une base de l'espace vectoriel des solutions du 
système. L'espace des solutions est donc de dimension n. 


La matrice R(t) est inversible quel que soit #. 


À est trigonalisable. On peut trouver une matrice inversible P telle que T = 
P-'AP est triangulaire, ou même triangulaire par blocs; les coefficients diagonaux 
de T sont les valeurs propres de A. On résout le système différentiel Y' = TY 
en prenant les équations successivement, comme dans l'exemple 2 page 482; on 
trouve n solutions Y1,Y2...,Y, indépendantes dont les coordonnées sont de la forme 
q(t)e!, où q(t) est une fonction polynôme et À une valeur propre de A. On dispose 


Y1(6),...,YA(t) en colonnes, on calcule la matrice carrée R(t)=P A () Pt) y, (t) 
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et les solutions sont les fonctions 
X(t) = R()K , où K est un vecteur de constantes quelconques. 


Les colonnes de R(t) forment une base de l’espace vectoriel des solutions. 


Les valeurs propres de À ne sont pas réelles. Soit À une valeur propre 
complexe de À et V un vecteur propre associé. Posons 


=a+iw et V=UV, +il» 
où a,w sont des nombres réels, w 0 et U;,U2 des vecteurs à coefficients réels. On a 
AV = XV = (a+iw)(Ui +iU2) = (aUs — wU:) + à (wU: + aU») 
donc en séparant partie réelle et partie imaginaire, il vient 
AU; = aU — wo ; AU = wU; + aU» 


Supposons À de taille 2. 
Les vecteurs U;,U2 étant indépendants (car w 0), la matrice de la transformation 


Z+ AZ dans la base (U;,U») de R? est C' = [_S 2 . Par conséquent, on a l'égalité 


C= PAP, où P = [U: U]. 


En posant X — PY, on sait que les fonctions Y(t) — Ë | sont solutions de 


Y!=CY, c'est-à-dire 


! 
Yi y : a w le] cu à 
]=r-cr-[ 2 | Le _ Lwyi + ay 


Introduisons la fonction z = y1 + 2y2. L'égalité vectorielle ci-dessus s'écrit 
2 = y + ég = (agi + wye) + é (uw + age) = (a — éw)(yn + go) = Àz 


d'où z(t) = ke, avec k= k1+ik2 un nombre complexe quelconque (remarque page 
444). Puisque et 


2(t)=(k1+ik2)e"* (coswt —isinwt) =e%[(kicoswt+kosinwt) +i(—ksinwt+ kicoswt)] 


pl = et | cos wt . [a] 


ya(t) —sinwt coswt] | ko 


et en posant K — LE | , il vient finalement 


= ete tt, On obtient ainsi 


__ at coswt sinwt = 
® A ne [a U] | sinwt COS ul FER 
où K est un vecteur constant quelconque. Les colonnes de R(t) forment une base 
de l’espace vectoriel des solutions : cet espace est donc de dimension 2. 
Supposons maintenant que À est de de taille n quelconque et diagonalisable sur C. Pro- 
cédons comme ci-dessus pour chaque vecteur propre complexe Us +iU2, Vi +iV2, etc 
écrivons les vecteurs Ui,U2,Vi,V2,... en colonne et complétons par les vecteurs propres 
réels : on forme ainsi une matrice carrée P inversible. Par le changement d’inconnue 


484 - SYSTÈMES DIFFÉRENTIELS LINÉAIRES 


© Dunod -— La photocopie non autorisée est un délit. 


X = PY, le système devient Y’ = CY, avec 


a w O0 0 :.. 0 
—w a 00 0 :.. 0 
00 cv 0 ::. 0 
0 O0 —& © O0 ::. 0 
C = 
0 T1 0 
0 re. 0 La 
a+iw, c+iv, etc étant les valeurs propres non réelles et r1,...,r,, les valeurs propres 


réelles de À. On résout le système Y”’ = CY bloc par bloc et les solutions sont les 
fonctions X(t) = PY(t) = R(t)K, où K est un vecteur formé de n constantes réelles 
arbitraires. L'espace des solutions est encore de dimension n. 


x! —2y-6 
y =z-y+2 
Une solution constante est déterminée par 2° = 2y — 6 —0 et y = x—y+2 = 0, donc 


Exemple 3. Considérons le système différentiel (5) { 


y =3,x — 1 et la fonction constante | à. est solution. Puisque la différence de deux 
solutions est une solution du système homogène, posons 
x] _fu 1] _[u+l 
PRO MHRES 
Onau = x =2y-6 = 2v et v' = y = x—-y+2 = (u+1) — (v+3) +2 = u—v, d'où le 
système différentiel en u,v : 


w|_f0 2]fu 
(æ) 1%] = [9 {] Le] 
Appelons À la matrice du système (h). 
Valeurs propres de À : ce sont les racines du polynôme caractéristique 


Es 2 = in -2= 2/42 9=1{3 1)(232) 


1 —1—-2 


Il y a deux valeurs propres distinctes 1 et —2, donc la matrice À est diagonalisable. 


Vecteurs propres de À : Un vecteur propre Vi = [6] pour la valeur propre 1 est 
solution de (A—1:)V1 = 4 s Le] = 0, donc V = | est vecteur propre 
pour la valeur propre 1. Pour la valeur propre —2, on a A+21: — Ë le donc 


m= |; 


Les solutions de (h) sont 


| est vecteur propre. 


u(t 2 r 1 
FA = kje’ [1] + he * E] , avec k; et k£2 quelconques, 
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a(t) | t[2 xl l 1 pie SU 
jé ]=he HELZ [1]+ 13] cesta-dire 
x(t) = 2ket + ke À +1 

y(t) = kieï — fers 
Il y a une seule solution de conditions initiales æ(to)=%0,y(to) yo : on la trouve en cal- 
culant les constantes k1 et ko telles que to—2k1et+k9e 2041 et yy—kiet—koe 2043, 


et les solutions de (S) sont | 


Dessin des trajectoires. Quand t parcourt R, le point M(t) = (æ(t),y(t)) décrit 

une courbe passant par le point initial Mo = (x0, Yo) : c'est la trajectoire de M5. 

Si la condition initiale est (1,3), la solution est la fonction constante (x(t),y(t)) —(1,3). 

La trajectoire du point E = (1,3) est donc réduite au point E : Le point E est un 

équilibre du système. 

Pour dessiner les différentes trajectoires, plaçons-nous dans le repère d’origine E et 

d’axes dirigés par les vecteurs propres V1, V2. On a EM(t) = kieïV, + ke ?tV, et 

les coordonnées de M(t) dans ce repère sont a = kiet, B = ke ?1. 

— Si k =0 et ko Æ 0, alors M(t) est sur l'axe dirigé par VW, 8 garde le signe de 
k> et tend vers Ü exponentiellement. Si k2 > 0, la trajectoire est la demi-droite 
d'origine Æ dirigée par V2 et parcourue vers E ; si k2 < 0, c'est la demi-droite 
opposée, parcourue également vers E (figure 1). 

— Si k) =0 et k: Z0, alors 5 =0 et à garde le signe de k;. Si ki > 0, la trajectoire est 
la demi-droite d'origine Æ dirigée par V\ et parcourue en s’éloignant vers l'infini; 
si k&1 < 0, c'est la demi-droite opposée (figure 1). 

— Supposons k1k2 £ 0. Pour trouver l'équation des trajectoires, éliminons t entre les 
égalités a = kie!,B = ke ?*. Il vient a?3= k?e?tke ?! = k?k2. La courbe d’équation 
B=c/ a, où c est une constante non nulle, est formée de deux branches ayant 
les axes pour asymptotes (figure 2). Chaque branche est une trajectoire (quand t 
varie, les coordonnées à et & gardent un signe constant). 


= eV; 


Figure 1 Figure 2 des trajectoires 
dans le plan x, y 


Exemple 4 : un modèle de compétition végétale. Deux espèces végétales 
(e1) et (e>) sont en compétition dans un périmètre donné. Le nombre d'individus 
de chaque espèce fluctue autour d’une valeur moyenne, avec des écarts x(t) et y(t) 
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satisfaisant le système différentiel 


ÿ =-(1/4)(x-: _1/4 1/4 
(5 = nes ns  . ee + 


À la suite d’une perturbation de l'écosystème, un recensement à l’instant t—0 montre 
que x(0) = x0 et y(0) = 0. Comment vont évoluer x(t) et y(t) ? 
Le polynôme caractéristique de A est z2?+22+2, les valeurs propres sont —1+4, —1—i 


et V= | _3 ss 4 | = | ) +i al est vecteur propre pour —1+4. D'après la formule (x) 
page 484, les solutions sont les fonctions X(t)—R(t)K, où K est un vecteur constant et 
_— 10 cost sint 
R(9 = e EE 0] Eee ie 
1 0 


On a R(0) — LE 4 


| donc X(0 es As Pour que x(0) = xo et yo = 0, il 

pal = TO cn di . 
faut prendre le vecteur K — pa tel que { pd De 0" està dire ki = x 
et ka = (3/4)x0. On obtient ainsi 


X(+) se] 1 ‘| | cost TO _ met] 1 A | 4 cos t+3 sin t 
= — sint cost] |(3/4)x0 | 4 —3 4] [—4sint+3cost 


eh die a] = T0, ee +3sint 


y(t) 4 —25sint 
et y(t) tendent vers 0 quand t tend vers l'infini : cela veut dire 
que les populations végétales reviennent à leur proportion d’équi- 
libre. La figure 1 montre la trajectoire dans le plan des (x,y) ; sur 
la figure 2, on a représenté les graphes des fonctions x(t) et y(t) 
(& est en abscisse). 

Dans la première équation du système différentiel, on voit que # 
s’annule quand z—y = 0 : les valeurs extrêmes de x(t) sont donc 
obtenues quand les deux populations ont le même nombre d’in- 
dividus. Cela correspond, sur la trajectoire, aux points à tangente 
verticale : ils sont sur la droite d’équation y — x. De même, les 
points de la trajectoire où la tangente est horizontale sont caracté- 
risés par ÿ — 0 : d’après la seconde équation du système, ils sont 
sur la droite d’équation y — —(25/7)x. 


| . Les fonctions x(t) figure 1 


figure 2 


1.2 Matrice résolvante 


Nous venons de voir que la solution générale d’un système différentiel X' = 
AX de taille n est toujours combinaison linéaire de n solutions indépendantes 
Xi(t), Xo(t),..., Xn(t). Si l’on dispose ces solutions en colonnes, on obtient la ma- 
trice R(t) = [Xi(t)-.: X,(t)] et la solution générale du système est X(t) = R(t)K, 
où À est un vecteur constant quelconque. 

Une telle matrice R(t) s'appelle une matrice résolvante du système. 
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La matrice R(t) est inversible quel que soit #. 
On a R'(t) = AR(t) quel que soit t. 
En effet R’(t) = [X{(t) X$(t) .…. X!(4)] = [AX:(t) AX2(t) .. AX,(t)] = AR(E). 


Solution avec condition initiale 

En pratique, on cherche souvent la solution X(t) prenant en { = to une valeur vec- 
torielle X (to) — Xo donnée. Pour que X{(to) = X0, il faut et il suffit que l’on ait 
R(to)K = Xo, ou encore K = R(t5) !X, ; on a donc X(t) = R(t)R(to) !X0-. 

La solution telle que X(to) = Xo est X(t) = Rat) Xo, où Ras(t) = R(t)R(to) *. 
On a Ralto) = 1. Prenons to — 0 et soit X(t) — Ro(t)Xo la solution telle que 
X(0) = Xo. Si a est un nombre réel, la fonction Y(t) = X(t+ a) est solution, car 
Y'(t)=X'(t+a)=AX(t+a)=AY(t). Puisque Y(0)=X(a), la fonction Y(t) est la so- 
lution telle que Y(0)= X(a), donc Y(t) = Ro(t)X (a). Puisque X(t+a)= Ro(t+a)Xo, 
il vient Ro(t + a) Xo = Roft)X(a) = Ro(t)Ro(a) X9 et comme cela est vrai quel que 
soit le vecteur initial X,, on en déduit l’identité matricielle 

Ro(t + a) = Rot) Ro(a) , quels que soient t et a. 
En particulier 1, = Ro(t — t) = Ro(t)Ro(-t), donc Ro(t) ! = Ro(-t). Il s'ensuit que 
pour tout entier k positif ou négatif, on a Ro(kt) — [Ro(t)]*. 
La fonction t+ Ro(t) transforme somme en produit et opposé en inverse, comme 
une exponentielle. 


Recherche de la matrice du système à partir des solutions 


Supposons que le système différentiel X’ — AX est de taille n. Si l’on en con- 
naît n solutions indépendantes X,,X2,...,X,, la matrice R(t) dont les colonnes 
sont X1(t), Xo(t),... XA(t) est une résolvante. Puisque R'(t) — AR(t), on en déduit 
A= R'(t}R(t) 1. 


Application : modélisation d'une diffusion compartimentale 
Une substance présente dans deux compartiments tissulaires (1) et (2) peut diffuser 
de l’un vers l’autre à un taux proportionnel à la quantité présente dans le comparti- 
ment source (loi d'action de masse). Soient x1(t) et x2(t) les quantités de substance 
présentes à l'instant { dans les compartiments (1) et (2). Ces fonctions sont solutions 
d’un système différentiel homogène (comparer à l'exercice 11 page 197) 


+ = ax + by 
(h) Ée 


Dans la pratique, les coefficients de diffusion a,b,c,d sont inconnus. En effectuant dans 
les compartiments des dosages à des instants {1,{2,..., on peut faire une estimation 
numérique des fonctions x et y. En général, x et y décroissent exponentiellement, 
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de sorte qu’on propose pour ces fonctions des formules du type 


{ a(t) = me +pe"* 
y(t) = met + pet! 
Il s’agit bien d’une forme possible pour une solution d’un système différentiel linéaire 
homogène. 

Procédons comme dans l'exemple page 305. En faisant varier les quantités initiales, 
on calcule des valeurs approchées pour les exposants À et À et pour les coefficients 


où À, 2, P1, D2, Q1, 2 sont des constantes. 


ya(#) 
Xo(t) = FA non proportionnelles. Formons la matrice R(t) — LX1() x]. 


P1: Po, Qi, : on peut ainsi obtenir deux fonctions de diffusion X,(t) — FI et 


ya(t) 
Les fonctions X et X2 sont solutions du système différentiel linéaire X = AX de 
matrice À — R(t)R(t)-! (R est la matrice dérivée par rapport à t). Les coefficients 
de À doivent être indépendants de {, mais on a intérêt à faire le calcul en prenant 
différentes valeurs de t et à retenir un résultat moyen. 
Les coefficients de la matrice À sont des estimations numériques des coefficients 
de diffusion a,b,c,d dans (h). 
— Une fois calculée la matrice À, on dispose du système différentiel X — AX qui per- 
met de résoudre le problème des diffusions pour n'importe quelle condition initiale. 
— On connaît les valeurs propres de À : ce sont les coefficients de { dans les 
exponentielles qui composent Xi(t) ou X2(#). 
Par exemple, supposons qu’on a fait les deux estimations 
ai(t)| _ [0,148e t#t+485e 0$t zo(t) | _ [0,528e 0#t}3,47e 08 
Fo _ Le Ent Dog ose " Eee | 2,32e ME11,68e 9#t | 


æi(t) æo(t) 
yi(t) yo(t) 
R(# = didge MPtjagses 06 jéose MES 17e tai (0) = ee N 

7 [0,652e 08549346 08 0528e 08t4347e 054] ? ” L[—1,28 —1,25 


Formons la matrice R(t)— | | et calculons sa dérivée en {—0 par exemple : 


La matrice du système est À — R(0)R(0)-! — [5% | Les valeurs propres 


de À sont —0,18 et —0,5. 


1.3 Principaux types de trajectoires 


La forme des trajectoires d’un système différentiel X’ = AX dépend des valeurs 

propres de À. 

L'origine est un point d'équilibre : il constitue une trajectoire. 

Si À est une valeur propre réelle avec vecteur propre V, la trajectoire associée à 
la solution propre eV est la demi-droite passant par l’origine et dirigée par V. 
La demi-droite opposée est la trajectoire associée à la solution —e\V. 
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Stabilité de l'équilibre 

L'origine © est un équilibre stable si toutes les solutions de condition initiale X(t0) 
voisines de zéro restent proches de O pour t > to. 

D'après les différents types de solutions trouvés lors de la résolution, on a le résultat 
suivant. 


Conditions de stabilité 

— Si toutes les valeurs propres de la matrice A ont leur partie réelle strictement négative, 
alors toutes les solutions de X'— AX tendent vers O quand t tend vers + et l'origine 
est un équilibre stable. 

Si l’une au moins des valeurs propres est de partie réelle strictement positive, l'origine 
est un équilibre instable. 

— Si la matrice À est diagonalisable et si toutes ses valeurs propres sont de partie réelle 
négative ou nulle, alors l'origine est un équilibre stable. 


Démonstration. Chaque valeur propre réelle À détermine une solution propre U(t)=e"V, 

où V un vecteur propre associé, de norme [[U(t)|| = e||V]|. Si À = 0, la norme de U(t) est 

constante. Si À < 0, la norme tend vers 0 en décroissant quand { tend vers +c. Si À > 0, la 

norme tend vers +oo quand { tend vers + et l'équilibre n’est pas stable. 

Si À—=a+iw est une valeur propre complexe, les solutions associées sont de la forme 
C1 COS(wt+1) 


— Pat 
ee É cos(wt+p2) 
que si a < 0, la norme de U(t) reste bornée par k quand t parcourt [0,+c![ et que si a < 0, 


| et l’on a [U(t)|| < ke**, où k est une constante; on en déduit 


la norme tend vers O0 quand { tend vers +00. 

Si À est diagonalisable, toute solution est combinaison linéaire de solutions du type précédent, 
d’où les affirmations ci-dessus dans ce cas. 

Quand À est seulement trigonalisable, les solutions peuvent avoir dans leur coordonnées des 
fonctions de la forme q(t)e** ou q(t)e"* cos(wt+w), où a est une partie réelle de valeur propre 
et q(t) un polynôme. Si a < 0, alors im, g(t}e®* = 0, donc ces fonctions restent bornées 


quand t parcourt [0,+co[. On en déduit que si toutes les valeurs propres sont de partie réelle 
strictement négative, alors toutes les solutions tendent vers O et l'équilibre est stable. ü 


Critère de stabilité en dimension 2. Supposons que la matrice A est de taille 2 
et possède au moins une valeur propre non nulle. Alors pour le système différentiel X'= AX, 
l'équilibre O est stable si et seulement si les coefficients du polynôme caractéristique de A 
sont positifs ou nuls. 


Démonstration. Pour que l'équilibre (0,0) soit stable, il faut que les valeurs propres soient 
de partie réelle négative ou nulle. Réciproquement, si les valeurs propres À et y: sont de partie 
réelle strictement négative, ou si À < y; = 0, l'équilibre est stable ; si leur partie réelle est nulle, 
alors À et y sont imaginaires pures (on a exclu le cas À = u = 0) et l'équilibre est stable, car 
les coordonnées des solutions sont des fonctions a cos(wt + (p). Ainsi l’équilibre est stable si et 
seulement si À et y; sont de partie réelle négative ou nulle. Le polynôme caractéristique de À 
est P=(2-))(2-yu) = 22 + pz+q, où p=—(\+u) et q = Au. Quand les racines sont réelles, 
elles sont toutes deux négatives ou nulles à la condition que leur produit q soit positif ou nul 
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et que leur somme —p soit négative ou nulle; quand les racines sont complexes conjuguées, 

on a g = ÀX > 0 et la condition de stabilité est —p = 2%e (À) < 0. ü 

Supposons encore la matrice À de taille 2. 

Si les valeurs propres sont réelles non nulles et de même signe, les trajectoires non 
rectilignes sont toutes tangentes à l’une des directions propres (figure 1). 

Si les valeurs propres sont réelles et de signes contraires, les trajectoires non recti- 
lignes sont des « branches hyperboliques » asymptotes aux directions propres (fig. 2). 


Si les valeurs propres sont non réelles (donc complexes conjuguées), les trajec- 
toires sont des spirales (figure 3), ou des ellipses dans le cas de valeurs propres 
imaginaires pures (voir figure page 499). 


Voici différentes possibilités de trajectoires, selon les valeurs propres À et y : 


y y y 
T T x 
ÀA<u<0 ÀA<0<y =a+ib 
équilibre stable équilibre instable bÆOeta < 0 
figure 1 figure 2 équilibre stable 
figure 3 


Si l’on change le signe de toutes les valeurs propres, les trajectoires sont les mêmes 
mais leur sens de parcours est inversé. 


On retrouve les dessins obtenus pages 187 et 188 dans l'étude des itérations linéaires. Ce 
n’est pas un hasard. En effet, si l’on choisit un pas h>0, les itérés de X5 par la transforma- 
tion X+--Ro(h)X sont les points X,,=[Ro(h)]" Xo. Puisqu'on a [Ro(h)]"=Ro(nh) d'après 
les propriétés de la résolvante Ro, il vient X,, = Ro(nh)X50, donc les points X,, sont sur la 
trajectoire de X,. Si par exemple À est la matrice diagonale de valeurs propres À et y, alors 
Ro(h) est diagonale de valeurs propres e* el}, Dans le cas À<y1<0, on a 0<e\* <ehh <1 
et la trajectoire a bien la forme des itérés d’un point par une matrice de valeurs propres 
strictement comprises entre 0 et 1. On retrouve de même les autres formes de trajectoires, 
selon la position de e” et de e“} par rapport à 1, c’est-à-dire selon le signe de À et y. 


1.4 Système avec second membre 


Pour résoudre un système différentiel linéaire (s) X’ = AX + B(t) où le second 

membre B(t) est un vecteur de fonctions, 

a) on résout le système homogène (h) X'=AX : les solutions de (h) s’écrivent X(t)— 
R(t)K, où R(t) est une matrice résolvante et X un vecteur constant quelconque ; 

b)et l’on cherche une solution particulière S(t) du système complet. 

Les solutions de (s) sont toutes les fonctions R(t)K + S(t), où K est un vecteur 

constant quelconque (propriété page 481). 


CHAPITRE 16 - SYSTÈMES DIFFÉRENTIELS - 491 


Dans les applications, le problème possède parfois une solution particulière évidente, 
par exemple une solution constante. Mais nous allons voir que l’on peut calculer 
une solution particulière de (s) au moyen des solutions de (h). 


Méthode de variation de la constante 
Cherchons une solution S(t) de la forme S(t) = R(t)K(t), où X(t) est une fonction 
inconnue : c’est la méthode de variation de la constante, analogue à celle pratiquée page 
444 pour une équation linéaire numérique. 
On a S'=R'K+RK", car chaque coefficient de S(t) est une somme de termes r(t)k(t), 
où r(t) et k(t) sont des coefficients de R et K. La condition pour que S(t) soit solution 
est donc 


S' = AS + B(t) R'K+RK'=ARK+B 
<= ARK + RK' = ARK +8B, car R = AR 
et en simplifiant par ARK, il vient RK' = B, ou encore K’ = R !B. 


S(t) = R(t)K(t) est solution de (s) si et seulement si K'(t) = R(t) 'B(t). 
On choisit une primitive de la fonction vectorielle R(t)-{B(t) en intégrant coefficient 


par coefficient et la solution générale de (s) s'écrit 
t 


X(t) = R(t)K + R(t) | R(s) !B(s) ds , avec À un vecteur de constantes. 


Exemple. Reprenons l'exemple de la diffusion d’une substance dans deux com- 
partiments tissulaires (page 488) en supposant que la matrice du système est 
_[—-21 “ 
ne 
Injectons la substance dans le compartiment (1) avec un débit vw. Les quantités x(t) 
et y(t) présentes dans les compartiments (1) et (2) sont alors solutions du système 


@ = A (+ [0] 
—2—2 1/4 
3 


Le polynôme caractéristique de À est Nu” =2?+32+(5/4)=(2+5/2)(2+1/2), 


les valeurs propres sont —5/2 et —1/2 et les vecteurs propres sont Vi = | _à et 


V = El La matrice résolvante du système homogène X’ = AX est donc 
26 L (6/2) (4/2) 
A9) = [Me 62 ve 0x] = | Er | 


es, (5/2) 


__ [ut 
eU/2 QA/2 | Le second membre est B(t) — | | et 


0 


L (5/2)t 
K'(t) = R(t) 7" B(t) = . Ée | 
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On a fre6/2x dt = 2 (5t-2)e/2} et fret dt = 2(t-2)el/2t, d'où 
3v/50)(5t—2)e (5/2) 

k(9 = |( 

o= [nemeies 


56 =ROKE = 2 | 5 TS | 


| Une solution particulière de (s) est donc 


La solution générale de (s) est 


- bre 6/2 + pe-Q/2t à toc? 
L 1 = 
X(#) = R(D | 51] + 50 = op GP gta à 45-36) 

25 
avec k. et k des constantes arbitraires. 
Supposons qu’à l'instant initial £ — 0 où l’on commence l'injection, les compartiments 
ne contiennent pas de substance. Les conditions initiales sont donc x(0) = y(0) = 0. 


En calculant les constantes k1 et k> pour satisfaire ces conditions, on obtient 


_[æ@)]l (3/25)e-6/2t4e 4/24 (4/5)t-28/25 
A FA a a 


Supposons qu’on arrête l'injection à l'instant T : passé cet instant, les fonctions x(t) 
et y(t) sont régies par le système homogène X’ = AX. Pour t>T, Lai est donc 


la solution Si(t) du système homogène telle que S1(7) = Sÿ(T). On a Si(t) = R(t)C, 
où le vecteur constant C' doit vérifier R(T)C = Si(T) ; en résolvant cette équation 
linéaire, on obtient C', ce qui permet de calculer S.(t). 

La figure ci-contre montre l'allure de la courbe (x(t),y(t)) n 
ainsi obtenue. La partie inférieure de la courbe correspond à (4=T) 
So(t) : tant que t <T,, les quantités x(t) et y(t) augmentent. 


À l'instant T,, il y a rebroussement : pour t > T', x(t) décrofît 


tandis que y(t) continue à croître jusqu’à un maximum, puis 
x(t) et y(t) décroissent vers 0 (partie supérieure de la courbe). 


Comme y(t) continue à croître un moment après l’arrêt de l’in- 


8 Y 


jection, il faut interrompre celle-ci à temps pour ne pas dépasser  ( 
la concentration maximale admissible dans le compartiment. 


Application à une équation linéaire du second ordre 
Considérons l’équation différentielle linéaire (e) x" + px’ + gx = b(t), où p et q sont 
des constantes. En posant y = x’, il vient y = x" = —px' — gx + b(t) et le système 
différentiel suivant est équivalent à (e) : 


5 a = y 
(9) à 
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TX 


Si l’on pose X — é 


l ce système s'écrit sous forme matricielle 


! O0 1 0 
X'— AX +B(t), avec À — Le | et B(t) = PAL 
La résolution de (s) fournit les solutions x(t) de (e). En particulier, la méthode de 
variation de la constante présentée ci-dessus permet toujours d'exprimer une solution 
particulière de (e) : les calculs conduisent à la formule page 451, où w est ici de la 
forme wpe Pt. 


Système différentiel linéaire contrôlé 


Considérons une quantité vectorielle X(t) régie par un système différentiel linéaire 
homogène X’ = AX de taille n. Supposons qu'on puisse modifier le système au 
moyen de paramètres de commande u;,u2,... agissant en continu. 


Exemple. Un four électrique est constitué d’une enceinte entourée d’une paroi 
chauffante épaisse. Notons 

 c; et © les capacités calorifiques de l’intérieur et de la paroi du four, 

 s; et s. les aires des parois intérieures et extérieures, 

7; et re les coefficients de radiation de la paroi intérieure et de la paroi extérieure. 
Les variations de température par convection sont proportionnels 
à la surface d'échange et à l’écart des températures. Notons T, 
la température moyenne dans la paroi, 7, et T; les températures 
à l'extérieur et à l’intérieur du four. Si u est le flux de chaleur 
apporté par le chauffage du four, les bilans caloriques conduisent 
aux équations suivantes : 


et sr = 7)=84mÛ01=0)4u (pour la paroi) 

GT; = STE "151 (pour l’intérieur). 
Introduisons les excès de température x = T, — Te et y = 7; —T; par rapport à 
l'extérieur. Puisque T,—T; = x—y, il vient 

al L [-(sere+siri)/cp siri/Cn [r sols 
y SiTi/ Ci —siri/ci | LY 0 

On peut régler u au moyen d’un dispositif électrique : u est le paramètre de contrôle 
et l’on dit que le système différentiel est contrôlé. La question est la suivante : 


par un réglage en continu u(t) convenable, peut-on, à partir de n'importe quelle 
température initiale, atteindre dans le four une température donnée quelconque ? 


Plus généralement, considérons un système différentiel linéaire de la forme 


X'=AX+BU , où 


Es 
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s 


- À est une matrice de taille n à coefficients constants, 

— B est une matrice constante à n lignes et m colonnes, 

 U est un vecteur dont les coefficients u1,u2,...,u», sont des paramètres. 

On dit que c'est un système contrôlé, avec paramètre de contrôle U. Comme dans le 
cadre des itérations affines (page 191), étudions si par une commande convenable, 
on peut amener la réponse X(t) dans l’état qu'on veut. 


2.1 Commandabilité 


Définition 

Le système contrôlé X’ = AX + BU est commandable si pour tout état initial X9 et 
es tout état final X 7, il existe un instant {; > 0 et une fonction continue U(t), 
0<t<tr, telle que la solution du système X7— = AX + BU(t) de condition initiale 
= X0 vérifie X(ts) = Xf. 


Quand un système est commandable, il est possible d'atteindre, en un temps fini, 
n'importe quel objectif X} à partir de n'importe quel état initial X5, au moyen 
d’une commande U(t) appropriée. Comme pour les itérations affines, introduisons 
la matrice de commandabilité. 


Définition 
La matrice de commandabilité du système est la matrice C=[ 4"-1B A°-2B ... AB B] 
obtenue en juxtaposant les n matrices A%-1B, AM ?2B,..., AB, B. La matrice C 


possède n lignes et nm colonnes. 


Critère de commandabilité. Le système linéaire contrôlé X' = AX + BU est com- 
mandable si et seulement si sa matrice de commandabilité est de rang n. 


Démonstration que la condition est suffisante. Choisissons comme résolvante du sys- 
tème X’= AX la matrice R = Ro telle que R(0) = Z2 (page 488). On a donc aussi R(t+1') = 
R(t)R(t) et R(t)-!=R(-t). Remarquons que la matrice B(*B) est carrée de taille n et posons 


M(s)=R(-s)B(B)['R(-s)] et Q= fus 


l'intégration se faisant coefficient par coefficient. Si la matrice Q est inversible, définissons la 
commande 

U(s) = (B)['R(-5)]Q T'Y, avec Y = R(-t;)X; — X5. 
Une solution nm du système X’ = AX + BU(t) est S(t) = R(t)K(t), avec K(t) = 
[res s)ds (page 492). On a R(-s)BU(s) = R(-s)B(*B)[*R(-s)] Q7-1Y. Comme 


Re es est une opération linéaire, il vient 


K(9) = |" RC-HECS) [CR(-s)]QY ds = RC-oBC IRC) ds| Q—Y 
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c'est-à-dire K(tr) = QQT'Y =Y, d'où S(t;) = R(t;)Y. Ajoutons à S(t) la solution R(t)X6 
du système homogène. On obtient une solution X(t) telle que X(t;) = R(tr)Xo + S(tr), donc 

X (65) = R(tr)Xo+R(Es)[R(-t5)X 5 —Xo] = R(t)Xo+X5—R(ts)Xo = X; 

X(0) = R(0)X0 + S(0) = Xo , car R(0) = 1, et S(0) = 0. 
La commande continue U(t) permet donc d'atteindre l’état final X} à partir de X0. 
Supposons maintenant que la matrice de commandabilité est de rang n. Faisons l’hypo- 
thèse que Q n’est pas inversible et cherchons une contradiction. Pour tout s, la matrice 
M(s) = [R(-s)B|'[R(-s)B] est symétrique et positive, donc Q aussi. Puisqu’on suppose Q 
non inversible, c'est qu'il existe un vecteur V € R" non nul, tel que {VQV = 0 (page 218). 
(CV)M(s)V ds = 'u ICV)R(-s)B]|? ds = 0, où || || désigne la norme 
euclidienne. La fonction sous le signe intégrale est continue et positive ou nulle, son intégrale 
est nulle, donc elle est nulle (page 288). On a donc ({V)R(s)B = 0 pour tout s € [-t},0]. 
En dérivant, il vient (V)R'(s)B = (V)AR(s)B = 0, car R' = AR, et en dérivant k fois, on 
obtient (tV)AËR(s)B = 0 pour tout s entre —{; et 0. En particulier, en prenant s = 0, on a 
R(0) = 1, et donc (*V)AFB = 0. Cette égalité est vraie pour tout k, donc 

CVIIA BR AE... AB BI=[ICRA BU CNIASS .., (VAE (F)B]|=0 

ou encore (*V)C = 0 en appelant C la matrice de commandabilité. Comme le vecteur-ligne 
IV n'est pas nul, cela exprime que les n lignes de C' ne sont pas indépendantes : c'est une 
contradiction. ü 


Cela s'écrit encore j 
0 


Exemple. Pour le modèle de four présenté dans l'exemple précédent, la matrice 

— (are + ar; Mes le, 
dvi 

ne sont pas proportionnelles, donc C est de rang 2 et le système est commandable. 


de commandabilité est C’= [AB B]= . Les deux lignes 


Ce résultat théorique n’est qu’un premier élément de réponse à la question posée, car 
dans la pratique, on ne dispose que d’une commande u(t) à valeurs positives ou nulles. 


2.2 Introduction au rétro-contrôle 


Pour une condition initiale donnée, la réponse X(t) d’un système différentiel contrôlé 
X'=— AX + BU dépend du vecteur de contrôle U = (u1,...,u») dont les coefficients 
agissent par les formules linéaires définies par B. Pour réaliser une commande au- 
tomatique, on fait à tout instant dépendre U de l’état X. On réalise ce couplage 
au moyen de différents dispositifs, comme par exemple un thermostat, qui mesurent 
l'état X et calculent la commande U(X). On dit qu’on a réalisé un bouclage du 
système. Le système fonctionne alors en mode automatique. 

Considérons seulement le cas d’un bouclage linéaire : le vecteur U(X) est de la forme 
—KX, où K est une matrice à m lignes et n colonnes; la matrice BK est alors carrée 
de taille n, comme la matrice À. Le système bouclé s'écrit X'=AX —BKX, ou encore 


(c) X'=(A-BK)X 


En général, on cherche à stabiliser dans le temps l’état X(t) : il s’agit donc de trouver 
une matrice X pour que le système différentiel (c) ait un équilibre stable. Lorsque 


Es 
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c'est possible, on dit que le système contrôlé X’ = AX + BU peut être stabilisé par 
bouclage linéaire. 


Critère de régulation. Tout système linéaire contrôlé commandable peut être stabilisé 
par bouclage linéaire. 


Nous verrons qu'on peut même trouver une matrice de bouclage K° pour que les 
valeurs propres du système (c) soient des nombres À,)2,...,, donnés à l’avance : 
en choisissant À; < 0 pour tout à, on obtient un système (c) dont toutes les solutions 
tendent vers l'équilibre À — 0, avec des coordonnées en eXit (si les À; sont deux 
à deux différents, toute solution est combinaison de solutions propres). Il est donc 
possible de régler la stabilisation à un niveau plus ou moins fort. 

La démonstration du critère montre comment calculer effectivement une matrice de 
bouclage K. 


Démonstration. Pour simplifier, supposons n = 3 et faisons la démonstration dans le cas 
d'une commande numérique : B est une matrice à une seule colonne et U = u est un 
nombre (m = 1). Le système contrôlé est X’ — AX + Bu et dans sa matrice de comman- 
dabilité C'=[42B AB B], les produits A°B sont des colonnes : la matrice C est donc 
carrée de taille 3. Supposons que le système est commandable, donc la matrice C' est inver- 
sible. On a 13=C7![4B AB B]=[C-142B CAB C1B], donc les colonnes C-!4?B, 


1 0 0 
C7lAB et C7!B sont les vecteurs canoniques E1 = |0 |, E2 = |1| et E3 — 1 . Posons 
0 0 1 


L=[100]C-!=(tE;)C"!. Puisque *E, = LC =[LA2B LAB LB|,ona 
L4B=1 et LAB=LB=0. 


L LC 100 
Soit P — | LA |. C'est une matrice carrée de taille 3 et l’on a PC'= | LAC | = | LAC |. 
LA? LA?C LA?C 


Montrons que la matrice PC' est inversible. 

— La deuxième ligne est LAC =|LA%B LA?B LAB]=|LAB 1 0]. D'après le théorème de 
Cayley-Hamilton (page 152), on a la relation AŸ=-—pA4?—qA—rls, où —(2%+pz?+qz+r) 
est le polynôme caractéristique de A. Il vient donc LAŸB = -pLA?B — qLAB —-rLB = -p 
et LAC =[-p 10]. 

— De même, LA4B—-pLA*B-qLA?B-rLAB=p-q et donc LA?2C=|] LAB LAB LA?2B]- 
(P=een tl: 

Les lignes de PC' sont en échelon, donc indépendantes, la matrice PC' est inversible et par 

suite aussi P. Dans le système X’ = AX + Bu, faisons le changement d’inconnue Y = PX. 

Il vient Y’ = PX' = PAX + PBu, ou encore 

(1) Y'=(PAP !)Y + PBu 

Pour calculer la matrice de ce système, rappelons-nous que les lignes d’une matrice M sont 

les produits (*Æ;)M. La première ligne de PAP! est donc 

CFE)PAP =LAP !, car (*E,)P = L est la première ligne de P 
='F2, car LA = ('E2)P est la deuxième ligne de P. 
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De même, la deuxième ligne de PAP! est (EH,)PAP-!=LA?2P l2tE,, car (tE2)P = LA 
et LA? = (tE3)P est la troisième ligne de P. Enfin, on a 
(Es)PAP 1=LASP 1=-pLA?P 1-QLAP 1-rLP l=-ptEs-gtEo-r'Ei=[-r —-q -p] 


0 1 0 LB 0 
Ainsi PAP-!= | 0 O0 1 |. Puisque PB = | LAB | = |0!|, on obtient 
—T —q —p LA?B 1 
0 1 0 
(1°) Y'=|0 0 1|Y+ÆEsu 
Se 
Un bouclage linéaire pour (1’) est de la forme u = —KY, où K —[—k1 —k2 —k3] est une 
0 1 0 
matrice-ligne formée de scalaires, et le système bouclé s'écrit Y’ = | 0 0 1 | —-ÆE:KY. 
SF D 
La matrice E,K, carrée de taille 3, a ses deux premières lignes nulles et la troisième est K, 
donc le système bouclé est 
0 1 (ù) 
(2) = 0 0 1 Y 
r—ki —q—k2 —p-ks 


Notons M la matrice du système différentiel (2). Le polynôme caractéristique de M est 
Qu = —(23+(p + k3)22+(q + ko)z+(r + ki1)). Il est possible de choisir k1,k2,k3 de manière 
que les racines de Q, soient des nombres donnés À1, 2,3 : en effet, il suffit d'écrire l'égalité 


Qu = —-(2-A1)(2-)2)(2—-)3), d'identifier les coefficients des puissances de z et d’en tirer 
k1,k2,k3 en fonction des À;. En choisissant tous les À; strictement négatifs, on obtient un 
bouclage stabilisant pour (1). 

Puisqu'on a seulement fait un changement linéaire d’inconnue, le système différentiel en X 
obtenu à partir de (2) est également stabilisé. Il s'écrit X’=(A-— BKP)X, donc u=-KPX 
est un bouclage stabilisant pour le système X’ = AX + Bu. = 


Exemple : une régulation in vivo. Considérons deux populations d'insectes, l’une 
servant de proies pour l’autre. En milieu naturel, quand le nombre moyen de proies 
est t»,, le nombre de prédateurs s'établit à y,,. Quand on élève ces populations dans 
un vivarium, le nombre de proies est x,, + x et le nombre de prédateurs est y, + y. 
Supposons pour simplifier que, dans ce milieu artificiel, les équations d'évolution sont 


x = 2% —3y 
(s) Le 


La matrice A — Ë | du système différentiel a pour polynôme caractéristique 
eu = z?—2+4 et les valeurs propres de À sont ; +i on La partie réelle 


est positive, donc les solutions du système ne restent pas bornées quand # tend vers 
+o (voir les trajectoires page 491) : on assiste à une croissance illimitée des deux 
populations. 

Supposons que dans des limites raisonnables, la température dans le vivarium agit 
sur le taux d’éclosion des œufs de proies sans affecter les prédateurs, avec un contrôle 


Es 


498 - SYSTÈME DIFFÉRENTIEL LINÉAIRE CONTRÔLI 


© Dunod -— La photocopie non autorisée est un délit. 


de la forme 
{ à = 22 — 3y+au 
ÿ —27—Y 
où u est l'écart à la température moyenne et a une constante positive. Peut-on réa- 
liser un bouclage de ce système de manière à stabiliser les populations quels que 
soient les effectifs initiaux ? 


Le système contrôlé est X = AX + él u et un bouclage s'écrit u — —kx, d’où le 
système bouclé 
(b) al herus: 


En posant r = ak, le polynôme caractéristique de la matrice de (b) est 


2—r—-z —3 


— 42 _ 
Re + (r-1)z+7 +4 


p=| 


Pour que l'équilibre (0,0) soit stable, il faut et il suffit que les coefficients r—1 et 
r+4 soient positifs ou nuls, c’est-à-dire que l’on ait r > 1, ou encore k > 1/a. 


- Pour k = 1/a, les solutions du système bouclé sont 


FA 7 LE sa al 1e | Ein  . | 


et les effectifs x», + x et Ym + y restent bornés quand { tend 
vers +0. Bien que les solutions ne tendent pas vers l’origine, 
l'équilibre est stable. 

- Pour k > 1/a, les valeurs propres sont de partie réelle stricte- 
ment négative, donc les solutions tendent vers (0,0) : le système 
est stabilisé et les effectifs tendent vers leurs valeurs d'équilibre 


Tm et Ym d'autant plus vite que k est plus grand. 


Systèmes différentiels généraux 


On rencontre le plus souvent des systèmes différentiels où X’ ne dépend pas 
linéairement de X. 

Nous avons montré page 478 que l’on peut ramener l'étude d’un système différentiel 
quelconque à celle d’un système autonome, c'est-à-dire un système où la loi différen- 


! _— 1 
tielle ne dépend pas du temps, comme par exemple {> = | . À . Dans la suite, 
— ? 
nous ne considérerons donc que des systèmes autonomes. 
T1 
T2 
On introduit le vecteur d'état X — | . | du système; il décrit un domaine de IR”. 
Ta 
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Définition ES 

Un système différentiel (autonome) s'écrit X' = F(X), où F(X)= | . Cha- 
fa(X) 

cune des fonctions f1,...,f, prend des valeurs réelles et possède des dérivées 


partielles 2 continues. Le domaine, ou l'espace des états du système différentiel, 
Fa 


est le domaine de définition commun aux fonctions f1,..., fn. 
x (t) 
. æo(t) 
Une solution est une fonction X(t) = | telle que X’(t) = F(X(t)) pour tout 
tn(t) 


t. Quand t varie, X(t) décrit une courbe dans l’espace R” des états. L'ensemble des 
points d’une courbe solution est une trajectoire. 


Exemple. Une équation différentielle du second ordre de la forme # = f(x, à) 


peut se transformer en un système différentiel. En posant y = #, il vient en effet 


{ = F a L'ensemble des états (x,y) du système s'appelle dans ce cas l’espace 


des phases de l'équation (voir page 462). 


Propriétés des solutions 


1) Si Xo est un point du domaine et t, un instant quelconque, il y a une unique solution X(t) 


ayant pour condition initiale X(to)=X,. La trajectoire associée s'appelle la trajectoire de X0. 
2) Si X(t) est une solution, alors pour tout nombre à, la fonction X(t+ a) est solution. 


Nous avons démontré ces résultats pour les systèmes différentiels linéaires et pour les 
équations différentielles numériques autonomes ; ils sont encore vrais pour les systèmes 
différentiels vérifiant la définition ci-dessus. La propriété (2) est spécifique des systèmes 
autonomes : si X({) est solution de X’ = F(X) et si l’on pose Y{(t) = X({+ a), alors 
Y'(#) = X'(t+a) = F(X(t+a)) = F(Y(t)) et Y(t) est encore solution, de même tra- 
jectoire que X(t). Pour étudier une solution, on peut donc supposer que sa condition 
initiale est X(0) = X5. 


Champ de vecteur associé au système. La fonction X > F(X), définie sur 
le domaine du système différentiel, prend ses valeurs dans R” : il s’agit d’un champ 


de vecteurs (chapitre 14). 
Le champ de vecteurs F(X) s'appelle le champ associé au système. 


— Une trajectoire du système différentiel est tangente en chacun de ses points au 


vecteur du champ : une trajectoire est donc une ligne de champ. 
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3.1 Équilibres et trajectoires 


Définition 
Un point Æ du domaine est un équilibre du système différentiel si la fonction 
constante X(t) = E est solution; sa trajectoire est réduite au point E. 


Pour qu'un point Æ soit un équilibre, il faut et il suffit que la fonction X(t) = E 
vérifie X/(t) = F(X(t)). Puisque X/(t) = 0, cette condition s'écrit 0 = F(E). 
Un équilibre est un point E tel que F(E) = 0. 


Propriétés des trajectoires 

— Deux trajectoires différentes ne se coupent pas. 

Les bouts d'une trajectoire sont en un point d'équilibre ou bien au bord du domaine. 

Si un bout de trajectoire est un équilibre E, les solutions sur cette trajectoire tendent 
vers E quand t tend vers +oo (ou quand € tend vers —c),. 


Exemple : étude d'un système proïes-prédateurs 


Reprenons le système différentiel introduit page 477 : 


 — qe , où les constantes à, b, c, d sont positives. 
Y = —cy + dry 
Puisque x et y sont des effectifs de population, le domaine est le quart de plan 
formé d l tel >0ety2>0. 
ormé des couples (x,y) tels que x et y ( +. ) 


Le champ de vecteurs dans IR? associé au système est F(x,y) — Ed 


Recherche des équilibres. Les équilibres sont les solutions du système d’équa- 
tions 
ax—bxy  —=0 æ(a—by) = 0 
ee ms 
Si x ou y est nul, alors +—y=—0 : il y a donc deux équilibres O—(0,0) et E—(c/d,a/b). 
Si les effectifs sont initialement x,—c/d et yo —a/b, ils restent à ces valeurs d'équilibre. 


Des solutions particulières 

En un point où x —0, le vecteur du champ est F(0,y) — (0, —cy) ; ces vecteurs 
étant verticaux, il y a des trajectoires portées par l’axe des ordonnées. Effective- 
ment, pour æ = 0, la seconde équation du système est y = —cy, elle ne contient 
pas x et a pour solutions y(t) = ype ‘*. Ainsi X(t) = (0,yoe ‘*) est une solution 
du système. La trajectoire est l’axe des ordonnées positives parcouru dans le sens 
décroissant et X(t) tend vers l'équilibre O quand t tend vers +oo. 

— De même, en tout point (x,0), le champ F(x,0) = (ax,0) est horizontal, donc il y 
a des trajectoires portées par l'axe des abscisses. Pour y = 0, la première équation 
est x’ — ax, donc X(t) — (xve"*,0) est solution du système. La trajectoire est l’axe 
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des abscisses positives parcouru dans le sens croissant et X(t) tend vers l'infini 
quand { tend vers +00. 


Sens de variation des solutions 

En chaque point (x,y) du domaine, l'orientation du vec- 
teur F(x,y) est fixée par le signe de ses composantes 
[æ(a—by), y(—c+ dx)]. Si par exemple on a æ > c/d et 
y > a/b, alors a—by < 0 et —c+ dx > 0, donc le champ 
est dirigé «vers le haut à gauche » : en ce point, on a 
x'(t) <0 et y/(t) > 0. Ainsi on obtient la représentation 
ci-contre qui permet de visualiser les variations de x(t) et 
de y(t) dans chacune des régions (1) à (IV). 

Prenons une solution X(t) dont la condition initiale est un point X situé dans la 
région (1). Sa trajectoire T' ne peut pas couper l’axe des ordonnées positives qui est 
lui-même une trajectoire, donc la courbe X(t) pénètre dans la région (77). Dès lors, 
T ne peut pas couper l'axe des abscisses positives qui est une trajectoire, donc X(t) 
pénètre dans la région (711). Ensuite, X(t) pourrait éventuellement rester dans cette 
région (avec une asymptote horizontale située sous l’ordonnée a/b), mais nous allons 
voir que ce n’est pas le cas. 


Équation des trajectoires. Cherchons y comme fonction de x. Puisqu’on a 
ÿ __ y(-c+dx) 
ä x(a — by) 


y'(x) = 
il vient . 
LV / (x) = LE 


s 


qui est une équation à variables séparées. En intégrant chaque membre, on trouve 
alny—by+clnx-dx=k, où k est une constante, et en prenant l’exponentielle, on obtient 


(1) (yte )(xe Æ)\=K, avec K > 0. 


Les trajectoires sont les courbes d’équation (1), pour les différentes valeurs de K. 


Les graphes des fonctions f(y) = y*e-tŸ et g(x) = x°e-d 


On a f'{y) = y le-t(a—by), le maximum 
de f(y) est atteint en y = a/b et vaut M, = 
(a/b)*e”® ; de même, le maximum de g(x) 
est obtenu en x =c/d et vaut M,;=(c/d)°e<. 
Si K > M;M,, l'équation (1) n’a donc pas 
de solution. Si K = M;M,,, la seule solution 
est l’équilibre (c/d, a/b). 

Supposons maintenant K =rM,, où 0 <r < M,;. L'équation g(x) = r a deux solutions 
æ1 et to, avec 0 < 1 < c/d < 2, et l’on a r/g(x) > 1 si x est en dehors du segment 
[1,22]. On en déduit que, pour x fixé, l'équation 


sont représentés ci-contre. 


(e) (y) = D 4 
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n'a pas de solution en y lorsque x est hors de [x:1,x2|, en a une seule y = a/b lorsque 
T=% où + = et que si æ1 < x < T2, alors (e) a deux solutions y_ (x) < a/b < y: (x). 
De plus, quand x tend vers +1 ou %2, y_(x) et y, (x) tendent vers a/b. Cela montre 
que les courbes définies par (1) sont fermées, comme sur la figure 1 ci-dessous. 


Ainsi, dans le domaine x > 0,y > 0, les trajectoires du systèmes sont fermées : les 
effectifs oscillent autour de l'équilibre E (figure 2). 


figure 2 


CAL 


0 T1 T c/d T2 T 


3.2 Stabilité d'un équilibre 


Dans l'étude des systèmes différentiels linéaires, nous avons rencontré des équilibres 
stables et des équilibres instables. 


Définition 

Un point d'équilibre E est stable si pour tout € > 0, la distance de X(t) à E reste 
inférieure à € quel que soit { > 0, pour toute solution X(t) de condition initiale 
X0 — X(0) assez proche de Æ. Si de plus chaque X(t) tend vers E quand t tend 
vers +co, on dit que Æ est un équilibre asymptotiquement stable. 


Dans l'exemple proies-prédateurs du précédent paragraphe, l'équilibre E est stable, 
mais pas asymptotiquement stable. 


Cas d'un système linéaire. Pour un système linéaire X’= AX, rappelons (page 

490) que l'origine est un équilibre 

stable si À est diagonalisable avec toutes ses valeurs propres de partie réelle 
négative ou nulle, 

— asymptotiquement stable si toutes les valeurs propres de A ont leur partie réelle 
strictement négative, 

instable si l’une au moins des valeurs propres de À est de partie réelle strictement 
positive. 


3.3 Linéarisation autour d'un équilibre 
Supposons que Æ est un point d'équilibre du système différentiel 
(1) * =hX 
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Pour approcher la fonction F(X) = (f(X),..., fa(X)) au voisinage de E, formons 
sa matrice jacobienne (page 367) au point E : 
of 0f oh 
Ôx, Oxo OT: 
Ofe Ofa . ôf: 
J(E) — | 0x1 OX OT; 


Ofn Ofn  Ofn 
Ôx, Oxo ln 


où les dérivées partielles sont calculées au point Æ. L'approximation affine de F au 
point Æ — (e1,...e,) s'écrit (page 364) 


Uu2 


F(E)+J(E) | . |. 
Un 
avec u; = t;,—e;. Puisqu'on a supposé F(E) = 0, il vient simplement 
J(E)U, en posant U = X-EF. 
Puisque U' = X’, introduisons le système différentiel linéaire 


(L) U' = J(E)U 


Le système différentiel linéaire U’ = J(E)U s'appelle le linéarisé de (1) au point E. 
Puisque (L) est une approximation de (1) autour de E, on peut espérer que dans une 
région assez petite autour de FE, les solutions de (1) ressemblent à celles de (Z) autour 
de l’origine. C’est effectivement ce qui se passe assez généralement. Supposons désor- 
mais que la fonction F possède des dérivées partielles d'ordre aussi grand qu’on veut. 


Définition 

Le système (1) est linéarisable autour de E si les trajectoires de (1) ont, au voisinage 

de F, la même forme que celles de (L) autour de l’origine, le sens de parcours étant 

conservé ainsi que les directions dans lesquelles les trajectoires s’approchent de Æ. 
Plus précisément, (1) est linéarisable s’il existe un changement de référentiel & (page 
24) qui transforme le point Æ en l’origine © et les trajectoires de (1) en celles de (L), 


avec la condition supplémentaire qu’au voisinage de E, on a (X) = U +o(U), avec 
CORATT 


Conditions de linéarisation. Si le système différentiel (1) vérifie l'une au moins des 
conditions suivantes, il est linéarisable autour de E. 


a) Le système est de taille 2 et aucune valeur propre de la matrice J(E) n'est de partie 
réelle nulle. 
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b) Les valeurs propres de J(E) sont toutes de parties réelles strictement négatives, ou bien 
toutes de parties réelles strictement positives. 
c)Il n'y a entre les valeurs propres À,...,X, de J(E) aucune relation de la forme 
Àj= Nm, avec des entiers n; positifs ou nuls de somme au moins égale à 2. 
La condition (c) est dite «de non résonance ». Si l’on y remplace les À; par leur expo- 


nentielle e, on obtient la condition de non résonance, rencontrée page 391, qui permet 
de linéariser une transformation ; les deux problèmes sont intimement liés. 


Si le système (1) est linéarisable autour de E, cet équilibre a évidemment les mêmes 
propriétés de stabilité que l'équilibre O du système linéaire (L). Pour étudier la 
stabilité d’un équilibre FE, on peut donc linéariser le système en ce point. 


Supposons le système (1) linéarisable autour de E. Alors 
l'équilibre E est stable si et seulement si l’origine est stable pour le système linéarisé; 


l'équilibre E est asymptotiquement stable si et seulement si l'origine est asymptotiquement 
stable pour le système linéarisé. 


Exemple. Étudions le système différentiel (1) = ie. 

Recherche des équilibres du système. Ce sont les solutions du système d’équa- 
—x+2y-x? = 0 
x(1+x—2y) = 0 
1—x? = 0, d'où x —1,y=—1 ou bien x = —1,y— 0. Il y a trois équilibres : O — (0,0), 
A= (1,1) et B= (-1,0). 


tions 


| . On trouve x = y = 0 et si x 0, il vient 1+x = 2y, donc 


Des trajectoires particulières. En tout point (x,y), le champ de vecteurs est 


_ [| —x+2y-x? : : : : : 
Fu ee | En un point de la droite d’équation y = x, le champ 


F(x,x) = LES | est dans la direction de cette droite, donc la droite y = x est 
réunion de trajectoires. En restreignant le système à cette droite, on obtient l'équation 
différentielle x = - = x—2?. 

Nous avons déjà étudié l’équation x’ —x—x? dans l'exemple page 448 : sur une 
droite représentant l’espace des x, il y a cinq trajectoires : les 
deux équilibres x = 0 et x = 1, l'intervalle ]—-c, 0] parcouru en 
décroissant (car x’ < 0 pour x < 0), l'intervalle ]0,1[ parcouru 
en croissant (car x > 0 pour 0 < x < 1) et l'intervalle ]1,+oo[ 
parcouru en décroissant (car x’ < 0 pour x > 1). 

La figure ci-contre montre les trajectoires correspondantes pour 


le système (1). On voit déjà que l’origine n’est pas un équilibre 
stable. 
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Etude au voisinage d'un équilibre Nous allons linéariser le système en cha- 
cun des points d'équilibre. Pour former la matrice jacobienne J(x,y) en un point 
quelconque, calculons les dérivées partielles de F : 


2 z+2y-r)=-1-2x , a eau?) = 2 
© (y+22—27y) = 1+27—2y , Q (x+2?—2xy) = —2x 
0x 0y 


Au point O.La matrice jacobienne de F en (0,0) est J = (4 o |: Son polynôme 


caractéristique est (—1—z)(—2)-2 — (2-1)(z+2), donc les valeurs propres sont 1 
et —2. Les vecteurs propres sont respectivement Vi — [1] et V> — | _?] . 


Pour avoir l'allure des trajectoires du système linéaire U' = JU, il suffit de se 
reporter à la figure 2 page 491. 

Il y a deux trajectoires rectilignes dans la direction W, 
deux dans la direction V2 et les autres sont de type 
«hyperbolique », avec pour asymptotes les directions propres 
Vi et V2. En linéarisant, on sait que, pour le système (1), 
l'allure des trajectoires autour de l’origine est la même. 


Au point À. Au point À = (1,1), la matrice jacobienne est 
J= 4 |: Le polynôme caractéristique est 
(-3-2)(-2-2)-2 = (2+1)(244), 
et les valeurs propres —1 et —4 ont pour vecteurs propres 


à nouveau W, = Vi et W: = VW. 
Mis à part les deux trajectoires rectilignes dans la direction 


V2, les trajectoires du système linéaire U' = JU sont tangentes à la direction propre 
de plus petite valeur propre (en valeur absolue), c’est-à-dire à WA (figure 1 page 
491). Par linéarisation, on en déduit qu’au voisinage de À, les trajectoires de (1) 
ont la même allure. Le point À est un équilibre asymptotiquement stable. 


1 2 
—1 2 


caractéristique est (1—2)(2—2) +2 et les valeurs propres sont À — (1/2)(3+4 V7) 
et u = (1/2)(3— 6 V7). 

Les trajectoires du système U’ = JU sont des spirales qui s’écartent de l'équilibre, 
car la partie réelle des valeurs propres est strictement positive 


Au point B.La matrice jacobienne en B = (—1,0) est J — | |: Le polynôme 


(figure 3 page 491). Il s'ensuit qu'au voisinage de B, les trajec- 
toires de (1) sont également en forme de spirales qui s’écartent 
de B. Le point B n’est donc pas un équilibre stable. Pour trou- 
ver le sens de parcours, remarquons qu’en un point de l'axe 
des x, on a y—0, donc y = x(1+x) <0 pour —-1 < x <0 : 
les spirales sont donc parcourues dans le sens inverse des aiguilles d’une montre. 
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La figure ci-dessous montre le champ de vecteurs et quelques trajectoires du système. 


3.4 Fonction de Liapounov 
Soit E un point d'équilibre pour le système différentiel X’ = F(X). 


Définition 

Une fonction de Liapounov pour l'équilibre E est une fonction V à valeurs réelles, dé- 
finie au voisinage de Æ, à dérivées partielles continues et satisfaisant les conditions 
suivantes : 

 V(E) = 0, 

ü V(X) > 0 pour tout X £E, 

ii) le produit scalaire Grady(X) - F(X) garde un signe constant. 


Les conditions (i] et (ï} signifient que V(X) présente un minimum au point E. Au 
voisinage de ce point, les lignes de niveau de V «encerclent» E et l’on sait que le 
vecteur gradient de V est orthogonal à ces lignes de niveau et dirigé vers l'extérieur : 
si Grady(X):F(X) est toujours négatif, alors F(X) pointe vers l’intérieur des 

lignes de niveau de V : le long d’une trajectoire, le niveau de V diminue (figure 1); 
- si au contraire Grady(X)-:F(X) est positif, F(X) pointe vers l'extérieur des lignes 

de niveau et quand on parcourt une trajectoire, le niveau de V augmente (figure 2). 


Figure ] Figure 2 


CHAPITRE 16 - SYSTÈMES DIFFÉRENTIELS - 507 


Soit X(t) une solution de point initial Xo — X(0) assez proche de E. D'après la 
règle de dérivation d’une fonction composée, on a 

LV (X(E) = Grady(X(t)) - X'/(#) = Grady(X(+)) - F(X(+)) 
Si le produit scalaire Grady(X):F(X) est toujours négatif ou nul, le niveau V(X(t)) 
est décroissant le long de la trajectoire de X. On en déduit que pour t > 0, X(t) 
est confinée à l’intérieur de la ligne du niveau initial : l'équilibre est stable. 
Montrons que si Grady(X):F(X) est strictement négatif, alors X(t) tend vers E. 


La fonction niveau n(t) = V(X(t)) est strictement décroissante, donc quand { tend vers 
+oo, n(t) a une limite m positive ou nulle. Puisque Æ est, d’après (i) et (ï), le seul point 
de niveau nul, il faut montrer que m—0. Raisonnons par l'absurde en supposant m > 0. 
Dans ce cas, la solution resterait dans la « couronne » formée des points de niveau com- 


pris entre m et le niveau initial ; cela implique que X(t) est défini pour tout {> 0. Or la 
couronne étant compacte, la fonction continue a = Grady(X(#))- F(X(+)) a un maxi- 
mum c< 0 dans cette couronne (page 362). En intégrant, on obtiendrait n{t) < n(0) + ct 
pour { > 0, et en prenant { assez grand, il viendrait n(t) < 0, ce qui est absurde. 


Énonçons ces résultats. 


Critère de stabilité de Liapounov. Supposons que V est une fonction de Liapounov 
pour l'équilibre E. 

— Si Grady(X) - F(X) < 0 pour tout X, l'équilibre est stable. 

Si Grady(X) : F(X) < 0 pour tout X # E, l'équilibre est asymptotiquement stable. 


Les lignes de niveau d’une fonction de Liapounov permettent de décrire le bassin de 
stabilité ou de stabilité asymptotique de l'équilibre, c’est-à-dire l’ensemble des points 
initiaux à partir desquels la solution va rester proche de E ou tendre vers E. 


Exemple. Prenons le système différentiel du pendule sur lequel on agit par une 
force g(&)à fonction de sa vitesse, où l’on suppose g dérivable. En posant y = à, le 
système devient 


= 
ÿ = —sinx —g(y)y 
L'origine O = (0,0) est un équilibre. La dérivée de g(y)y en y — 0 est g(0), donc le 


système linéarisé en O a pour matrice À = [Si 


est 2? + g(0)z+ 1. 

Supposons g(0) > 0. Le polynôme caractéristique de À a ses coefficients positifs 
et la somme des racines est —2g(0) < 0, donc les racines sont de partie réelle 
strictement négative (page 490). L'équilibre © est asymptotiquement stable pour le 
système linéarisé et, par linéarisation, on en déduit que l’origine est aussi asymp- 


- d0) | . Le polynôme caractéristique 
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totiquement stable pour le système initial. Pour de petites vitesses, —g(t)à a le 
signe opposé de #, donc le pendule est amorti. 

Supposons g(0) — 0 et g(y) > O0 pour tout y. Cette fois, le système n’est plus 
linéarisable autour de l’origine, car les valeurs propres du linéarisé sont +3. Mais 
prenons la fonction énergie V(x, y) = (1/2)y°? + 1 — cosx. Puisque 1 — cosx > 0, 
V(x,y) est positif ou nul et n’est nul que si y — 1—cosx — 0 : dans le domaine 
—T <zx<, cela implique y=x—0. Ona 


OV OV 
OT 0y 


Grady(X) = | | ={[sinxz y], donc 


Grady(X)- F(X) =[sinx y] | —ÿ g(y) 


y _ 
—sinx — 4 _ 
Ce produit scalaire est toujours négatif ou nul, donc l'équilibre est stable. 

— Si g(y) est n’est pas identiquement nul, l'énergie V(X(t)) diminue le long d’une 
trajectoire : il n’y a pas de trajectoire fermée et donc pas de solution périodique. 
Si l’on a g(y) >0 pour yÆ0, alors Grady(X)-F(X) est strictement y 
négatif sauf aux points où y—0 et cela implique que les solutions 
tendent vers 0 : l’origine est un équilibre asymptotiquement stable. 
Le dessin ci-contre montre une trajectoire dans le cas g(y) = y°. % 
— Si g(y) est identiquement nul, le système est celui du pendule 
simple et sur chaque trajectoire, le niveau de V reste constant. Les trajectoires 
proches de l’origine sont fermées (figure 2 page 463) et l'équilibre n’est pas 
asymptotiquement stable. 


Remarque 

Souvent, on cherche une fonction de Liapounov en s'inspirant des caractéristiques 
physiques du système, comme dans l'exemple ci-dessus. 

Voici un autre moyen de construire des fonctions ayant les propriétés (i) et (ii) de la 
définition. Considérons une matrice S symétrique définie positive (page 218). Si l’on 
pose V(X) = (X)SX pour tout vecteur X € R”, alors on a V(0) —0 et V(X) > 0 
pour tout X # 0. 


3.5 Systèmes hamiltoniens 


En Mécanique, un mouvement X({t) dans un champ de force qui dérive d’un potentiel 
—V est solution d’un système différentiel du second ordre, du type 


(1) X = -Grady(X) 


En plus de la variable X = (x1,...,æ,), introduisons les variables p; — à; et posons 
P=(p1,...,Pn). L'espace des variables (%1,12,...,%n,p1 p2,...,Pn) = (X,P) s'appelle 
l'espace des phases ; il est de dimension 2n. Comme dans l'étude du pendule page 
462, définissons 
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— l'énergie cinétique T(P) = SU? +... +pÀ) 
et l'énergie totale H(X, P) = T(P) + V(X), somme de l'énergie cinétique et de 
l'énergie potentielle. 
OH __ OT 
ne Opi dpi 
donc (1) est équivalent à 


OH __ OV 
OT; Ôt; : 


OV 
Ôt; < 


La i-ième équation de (1) est p; = à; = — 


à = _ 

Di 

@) p, = 0H 
: ÔT; 


La fonction H s'appelle le Hamiltonien du système (1). Puisque le Hamiltonien est 
l'énergie totale d’un état du système, cette fonction prend une valeur constante le 
long de toute solution de (1) (page 425). 


Si X(t) est une solution de (1), la fonction est constante. 


gts , d yon ’ 
On vérifie en effet que l’on a a A(X() =); dE di +) SE OH ;, = = 0, car d’après 
(2), SE à + Sd = = 0 pour tout 1. 


Ce résultat signifie que dans l’espace des phases, chaque trajectoire de (2) est in- 
cluse dans une ligne, ou en général une surface, d’équation H(X, P) — constante, 
c'est-à-dire dans une surface de niveau de la fonction F1. 

Pour un tel système de taille deux, on peut ainsi calculer l'équation des trajectoires. 


Exemple. Soit le système différentiel PE = A +z Posons f(x,y) = 4y*+x 
y =-(42°+y) | 
et g(x,y) = 4x%+y. On a Tr = 2 = 1, donc il existe une fonction H telle que 


| L en = [g(x,y) f(x, y)] (page 420). Le système s'écrit 


w = f(x, y) = y) 


De 
: "ox 
y = —g{x,y) = Er y) 


et d’après ce qui précède, on en déduit que les trajectoires ont pour équation 
H(x,y) = K, où K est constant. Calculons H(x, y). 


_ = 4ÿ+x donc H(x,y) = y*+xy + u(x) 
y 
= y+u'(x) = 4x +y donc u'(x) = 4x et u(x) = x°+ constante 


On trouve ainsi H(x,y) =x*+y1+xy et les trajectoires du système, 
représentées ci-contre, ont pour équation 4+y*+xy= constante. Les 
équilibres sont donnés par f{x,y) = g(x,y) =0; il en a trois : (0,0), 
(1/2,—1/2) et (—1/2,1/2). Les deux derniers sont visiblement stables. 
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4. Dépendance par rapport à la condition initiale 


On est parfois intéressé par la manière dont une solution d’un système différentiel 
X'=— F(X) dépend de sa condition initiale. Pour tout vecteur a —[a1,...,a,], notons 
X(t,a) la solution de condition initiale X(0,a) — a, et posons 


Vi(t,a) = 2 X(+,a) 


Ja; 


Puisque X(0,a) — a pour tout a, on a Y:(0,a) = E;, le i-ème vecteur canonique. 


Par définition D X(E,0) = F(X(t, a)), donc en dérivant par rapport à à;, il vient 


ns DX(E a) = Jr(X(t,a)) A X(,0) = Jr(X(t,a))Y;(f, a) 


où Jr est la matrice jacobienne de F'. Puisqu’on peut dériver dans l’ordre qu’on 


veut, on en déduit 


(1) D Yi(E a) = Jr(X(t,a))Yi(t, a) 


La fonction tr Yi(t,a) est la solution du système 

différentiel linéaire (1) telle que Y;(0) = E;. 
En général, ce système n’est pas à coefficients constants, car la matrice Jr (X (é, a)) 
dépend de t. 


Remarque 
Lorsque F a des dérivées partielles continues, les solutions du système différentiel 
X'=F(X) ont ainsi des dérivées partielles par rapport aux coordonnées de la condition 


initiale : les solutions dépendent donc continûment de leur condition initiale. 


Cas où a est un équilibre. Supposons que la condition initiale a est un point 
d'équilibre du système. Dans ce cas, on a X(f,a) = a pour tout & et le système 


différentiel (1) devient simplement 


HV (a) = Jr(a) (6, a) 

ôt 
C'est un système différentiel linéaire à coefficients constants, de matrice Jr(a). 
En calculant la solution Y;(t) telle que Y;(0) = Æ;, on trouve que pour un petit 


accroissement a; de la i-ème coordonnée de a, on a 


X(4,(a1,...,@i+0a,...,an)) © a + (6a)Y;(t, E) 
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5. Un exemple de prévision en épidémiologie 


Voici un exemple de modélisation pour une épidémie à durée d’incubation courte par 
rapport au temps pendant lequel un sujet est contagieux ; ce modèle a été proposé ini- 
tialement pour certains types de MST. On suppose la maladie non mortelle, la propaga- 
tion se faisant dans un groupe constitué de c, hommes et de c« femmes. On considère 


des hommes infectés, soignés dans une proportion a: ; 

des femmes infectées, soignées dans une proportion a2 : ces cas étant assez souvent 
asymptomatiques, a est petit devant a: ; 

un taux d'infection masculine proportionnel au nombre d'hommes sains et de 
femmes infectées (coefficient b:); 

un taux d'infection féminine proportionnel au nombre de femmes saines et 
d'hommes infectés (coefficient bo). 


Notons x(t) le nombre d'hommes infectés et y(t) le nombre de femmes infectées. 
Il y a donc c; — x(t) hommes et € — y(t) femmes susceptibles de tomber malades. 
Les équations s’écrivent 

& = —-ax + bi(c—-x)y N 
1 . , où 0 < æx(0) < ce; et O0 < y(0) < ©. 
qu) e ete (0) <a y(0) < e 


y 


pente —a2/bicr 


Étudions le champ de vecteurs F(x,y) associé. 

- En un point de l’axe des y > 0, on a F(0,y) = (bic1y, —a2y), 
donc le champ pointe «en bas à droite ». En un point de l'axe 
des x > 0, on a F(x,0) = (—aix, bcox) et le champ pointe 
«en haut à gauche ». 


pente —b2c2/a1 
x 


— Cherchons les points (x,y) où le champ est vertical : on doit avoir —ax+b1(c—x)y= 


Te … a1T _ 
0, d'où y = Pre | v(x). 


Les points où le champ est horizontal vérifient —a2y + b2(co—y)x = 0, d'où 


b2C2x 
ÿ @2 + bot (&) 


Voici les graphes des fonctions w(x) et h(x) : selon la valeur des constantes, il y a 
deux dispositions possibles pour ces courbes : 


y Figure 2 


La figure 1 montre Le cas aja2 < bibicico. Au point E d'intersection des courbes, on 
a v(x) = h(x) = y, donc le champ est nul : Æ est un point d'équilibre. 
La figure 2 correspond au cas aja2 > bib2c1c. 
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Cas aja2 < b1b2C1c2 

Il y a quatre régions et la figure ci-contre montre dans 

chacune d’elles la direction du champ. Par exemple, dans 

la région (I), on a v(x) < y < h(x), donc à >0 et y>0; 

dans la région (I), on a y<h(x) et y<w(x), donc #<0 et 

ÿ > 0. On en déduit le sens de variation des trajectoires. 

Considérons une solution qui a un point dans la ré- 
gion (1) à un certain instant #. Comme le champ est 
horizontal le long du bord supérieur de (I) et que la solution progresse dans le 
sens æ et y croissants, la solution ne peut pas s'échapper de (1) par en haut; 
de même, le champ étant vertical le long du bord inférieur, la solution ne peut 
s'échapper par en bas. Ainsi, la solution reste dans (1) pour tout t > to : 


la région (1) est une zone piège. 
On en déduit qu'une solution qui a pénétré dans (I) tend vers l'équilibre Æ 
quand t tend vers +00. 

— De même, la région (II) est une zone piège : toute solution qui a pénétré dans 
(I) y reste ultérieurement et donc tend vers Æ. 

— Considérons une solution X(t) = (x(t),y(t)) de point initial dans (II). Tant que 
X(t) est dans (I), x décroît et y croit : X(t) doit donc pénétrer dans l’une 
des régions (1) ou (II) et dès lors, X(t) tend vers Æ quand t tend vers l'infini. 
La seule exception concerne le cas où X(t) tend directement vers E en restant 
dans la région (I). 

— De même, une solution initialement dans (IV) doit pénétrer dans (1) ou dans 
(I), à moins qu’elle ne tende vers E en restant dans (IV); en tous cas, cette 
solution tend vers Æ. 


Ainsi toutes les solutions tendent vers Æ quand t tend vers l'infini. L'équilibre E 

est asymptotiquement stable. 

Pour calculer les coordonnées à, 6 de E, on résout l'équation v(x) = h(x) et l’on 

a B = h(a) = v(a). 

Conclusion : Si ma 2e > 1, le nombre d’hommes infectés tend vers «& et le 

nombre de femmes infectées vers 5. L'épidémie prend un régime stationnaire. 

Cas aja2 > b1b2C1C2 

Il y a trois régions et dans chacune d’elles, le champ a la direction indiquée ci-contre. 

Par exemple, dans la région (Il), on a (x) < y < u(x), 

donc # et ÿ sont négatifs ; dans la région (II), y < A(x) 

donc à < 0 et y > 0. 

— La région (Il) est un piège : dans cette zone, x et y 
décroissent, donc la solution ne peut s’en échapper 
ni par en haut (champ vertical sur la frontière), ni 
par en bas (champ horizontal sur la frontière). Si une 
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solution a un point dans (Il) à un instant to, elle y reste donc pour tout t > to 
et par suite tend vers l’origine. 


Toute solution issue d’un point de (1) ou d’un point de (IT) pénètre nécessairement 
dans (Il) et donc tend vers l’origine. 
bic b2cCo 


Conclusion : Si ———* < 1, le nombre de sujets infectés tend vers zéro quand 
a2 a 


1 
t tend vers l'infini : l'épidémie s'arrête. 
Le rapport b2c/a: est le nombre moyen de femmes contactées par un homme in- 
fecté et en cours de traitement; on a une interprétation analogue du rapport bic1/a. 


Ces nombres sont des «taux de contact ». On est amené, en pratique, à partager une 
population donnée en différentes classes ayant chacune leurs taux de contacts. 


6. Étude du moteur électrique 


Un moteur électrique se compose essentiellement de deux parties : d’une part un 
électro-aimant fixe, appelé stator ; d'autre part, une partie mobile, le rotor, situé dans 
le champ du stator. Le rotor est constitué d’un cylindre porté par l’arbre du moteur 
et solidaire de bobines alimentées en courant par le collecteur (des bandes latérales 
isolées les unes des autres sur la paroi du cylindre) au moyen de deux contacts 
latéraux (les balais). 
Les champs magnétiques dans le stator et le rotor tendent à s’aligner : par une ha- 
bile disposition géométrique des bobinages, on exploite cette propriété de manière à 
produire un couple moteur sur l’axe du rotor. 
Notons l'angle entre les champs magnétiques du stator et du rotor. Le couple 
moteur est une fonction périodique f(4) et l'induction électromagnétique crée aussi 
sur l’axe un couple résistant de moment proportionnel à la vitesse angulaire, donc 
de la forme kô. En supposant que le couple de charge M est constant, l'équation 
du mouvement s'écrit 

1 = M — kô — f(6) 


où Î est le moment d'inertie du rotor par rapport à son axe et £ une constante po- 
sitive. En première approximation, la fonction f est sinusoïdale, de la forme msin6, 
avec m > 0. Finalement, l'équation est du type 


(1) Ü = —aÿ — sin0 +b 

où les constantes a et b sont positives. Nous supposons a > 0 (dans le cas limite 
a — 0, (1) est une équation de Newton et l'étude se fait comme au chapitre 15). 
En posant v — 6, on obtient le système différentiel autonome 


(2) — 


d = —sin0 — av +b 
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dv Ù Ù 


Si l’on considère v comme fonction de 6, alors 4 — . — — et le système (2) s'écrit 
) 
(11) ve = av sin 0 +b 
Le graphe d’une solution de (1'} définit une trajectoire de (2) dans le plan des phases 
dv 


(8,v). L'isocline pour la pente 0, lieu des points (4,v) où 
b—sin0 


pr] — 0, est la courbe d’équa- 

tion v — . À un changement d’unité près, celle-ci s'obtient en translatant de 
a 

b le graphe de 0 — —sin@ le long de l’axe vw (figures 1 et 2). 


> Si b > 1, l’isocline reste au dessus de l’axe des abscisses. On a _. > 0 entre cet 
dv 


axe et l’isocline, et 40 < 0 ailleurs; 
Si 0 <b<1, l’isocline coupe l'axe des abscisses : il y a un nombre 6, tel que 
0<8<7/2 et sindy—b. Entre 0 et 27, les abscisses d’intersection sont 4 et 41 —=7—60. 


On a encore _ > 0 entre l’axe des abscisses et l’isocline et l’on a _ < 0 ailleurs. 


figure 1 0 | figure 2 
Puisque 0 — v, le sens de parcours sur une trajectoire est celui pour lequel 4 est 
croissant dans le demi-plan v > 0, décroissant dans le demi-plan v < 0. 
Le second membre de (1') est périodique de période 27 en 6. Il en résulte que si 
0 + w(0) est une solution, alors 0 + u(0 + 27) est aussi solution. 


Les équilibres 


Il sont définis par v = 0 = —av — sin 0 +b : ce sont donc les points où l’isocline 
précédente coupe l'axe des abscisses. Si b > 1, il n’y a pas d'équilibre. Si 0 < b <1, 
il y a deux équilibres dans la bande 0 < 0 < 2x : les points Ao = (66,0) et A:(61,0), 
situés symétriquement par rapport à l’abscisse 7/2. 

Si une trajectoire coupe l’isocline ailleurs qu’en un point d'équilibre, elle le fait avec 
une tangente horizontale; si une trajectoire coupe l'axe des abscisses, la tangente en 
ce point est verticale. 


Étude dans le cas b > 1 

Il n’y a pas d'équilibre, mais nous allons montrer que l'équation différentielle (1’) 
possède une solution + v(#) périodique de période 27. Cela correspond à un mou- 
vement périodique puisqu’à chaque tour de moteur, la vitesse de rotation revient à 
sa valeur initiale (mais la rotation n’est pas uniforme). 
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Rappelons que les solutions v(8) de (1') sont décroissantes dans leur partie située 


b—sin0 
a 


au dessus de l’isocline v — et qu’elles sont croissantes dans leur partie située 


entre l’isocline et l’axe des abscisses (figure 1). 

Considérons des solutions v() telles que v(r/2) = v > 0. Nous allons voir que si 
vo est assez grand, alors on a v(r/2 +27) < w et que si vo est assez petit, on a au 
contraire v(r/2 +27) > vo. 


> Supposons vo > —. Si la solution reste constamment au dessus de l'isocline pour 
n/2 <0 << x/2+27r = 57/2, elle décroît et l’on a v(57/2) < vo. Sinon, la solution 
passe sous l’isocline, devient croissante, franchit à nouveau l’isocline, puis décroft 
jusqu’à l’abscisse 57/2 (figure 3); dans ce cas, v(8) n’a pu dépasser le maximum 


de l’isocline qui a pour valeur (b+1)/a : on a donc encore v(57/2) < vo. 


Supposons 0 < vo < 2. La solution commence par 
croître puis franchit l’isocline; dès lors, la solution 
reste au dessus de l’isocline jusqu’à 0 — 57/2, car 
le champ de direction le long de l’isocline est hori- 


zontal (figure 3). Par suite, v(5r/2) est supérieur au 


minimum (b—1)/a de l’isocline, donc v(57/2) > vo. 


Puisque les solutions de (1”) dépendent continûment de leur condition initiale, il 


doit exister une valeur de w pour laquelle v(57/2) = vo. 


N 


En effet, considérons la fonction qui à une valeur vw > 0 associe la différence 
g(vo) = v(57/2) — vo, où v est la solution telle que v(x/2) — vw. La fonction v, diffé- 
rence de deux fonctions continues, est continue sur |0,+co[. On vient de montrer que 
p(vo) est négatif si vw est assez grand et positif si w est assez petit. D'après le théo- 
rème des valeurs intermédiaires, il existe donc une valeur v telle que w(vi)=0. Pour 
la solution 0 v*(0) telle que v*(r/2)=v, on a ainsi v*(r/2)—v*(57/2). Le second 
membre de (1’) étant périodique de période 27 en 0, la fonction w(0) — v*(9 + 2x) 
est solution et comme on a w(r/2) = v*(x/2), on en déduit w(4) — v“*(4) quel que 
soit 0 : autrement dit, la solution v* est périodique de période 27. 

Dans le mouvement correspondant, le rotor re- 
vient dans la même position et à la même 
vitesse après un tour, donc la rotation se pour- 
suit à l'identique. Cette solution est indiquée 


sur la figure 3. La figure 4 montre plusieurs 


N 
N 
N 
N 
N 
NN 
ns = 
ad 
1 


trajectoires : on voit qu’elles se rapprochent de 


la solution périodique quand 4 devient grand. figure 4 
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Le cylindre des phases. I1 est commode de visualiser le mouvement dans le 
cylindre des phases construit de la manière suivante : 


- enroulons sur lui-même le plan des phases (0,v) pour en faire 


& 
> 


un rouleau cylindrique (comme avec une feuille de papier), 
de manière que l’axe des 0 se transforme en un cercle de 
périmètre 2r et l’axe des v en une génératrice du cylindre. 


Cette opération identifie des points (4,v) et (d+2T,v) corres- 
pondant à la même vitesse et à des abscisses qui diffèrent de 
2x : dans le cylindre des phases, l’abscisse parcourt un cercle 
de longueur 27. Les trajectoires de (2) se transforment en des 
courbes tracées sur le cylindre, ce qui rend bien compte du 
mouvement puisque, dans une rotation, 0 se compte modulo 
27. La trajectoire correspondant à la solution périodique v* de- 


vient une courbe fermée 7 faisant le tour du cylindre : c’est un 
cycle de fonctionnement régulier du moteur (figure 5). 
Sur le cylindre, les trajectoires tendent vers ce cycle limite : cela 


signifie que le moteur tend vers ce régime de rotation stable. 


Étude des équilibres dans le cas 0 < b <1 


Pour le système (2), la matrice jacobienne en un point (4,v) est J = Le a L de 


osû —a 
polynôme caractéristique P = z:? + az + cos0. Au point d'équilibre A9 = (06,0), on 
a cos do = V1—-b? ; au point A1 = (rx — 0,0), on a cos 0 — cos(n—60) = —V/1—-b2. 


Étude au point d'équilibre A. Au point A1, les valeurs propres sont réelles 
de signes contraires, car leur produit est cos 4, < 0 : le point À; est un équilibre 
hyperbolique (équilibre de droite sur les figures 6 et 7). 
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Étude au point d'équilibre Ao 


- Si a > 4V1-b, le discriminant de P est positif, donc les valeurs propres sont 
réelles, de produit cos 4, > 0; elles sont de même signe, celui de leur somme 
—a < 0 : les deux valeurs propres sont négatives et par conséquent, les trajectoires 
tendent vers l'équilibre As (figure é). 


Si a? <4V1-b, les racines de P sont complexes conjuguées de partie réelle 
—a/2 < 0 : autour de l'équilibre A), les trajectoires sont des spirales tendant vers 
Ao (figure 7). 


Sur les trajectoires qui tendent vers l'équilibre A5, 
le moteur «ne fonctionne pas ». Dans certains cas, 
il n'existe même aucune trajectoire fermée dans le 
cylindre des phases. 

On peut montrer que si a n’est pas trop grand, il 
existe encore une solution périodique en 0 (figure 
8). Dans le cylindre des phases, on obtient à nou- 
veau un cycle limite représentant pour le moteur 


figure 7 


figure 8 


un régime stable. 


7. Une méthode de résolution numérique 


Considérons un système différentiel général X’— F(t, X) et la solution X(t) de 
condition initiale X (49) = X9. On cherche à calculer une approximation numérique 
du vecteur X(T), valeur à l'instant T de la solution. 


La méthode d'Euler. Subdivisons l'intervalle d’extrémités to et T'en n segments 
de longueur |h|, où k = (T —t5)/n : on introduit donc les points 


to, ti =toth, t=to+2h, ... , tn =tot+nh=T 
En to, on a X(to) = Xo et X’(to) = F(to, Xo), donc il vient 
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où r(h) désigne une quantité vectorielle dont la norme est négligeable devant À 
quand À tend vers 0. 

En posant Y: = X5+hF(to, X0) on obtient donc une approximation de X({;). En ti, 
la dérivée X'(t1) = F(H1,X(t1)) est en général différente de F(t1,Y1), mais pour |A| 
petit, elle est peu différente : puisque X(t)=X(t1+h)=X(4)+hF(t4,X(#))+r1(h) 
avec |fr1(h)|] a h, on prend comme valeur approchée de X({) la quantité Y> = 
Yi +hRF(t,Y1). Continuant ainsi, on pose Yo — Xo, 

Vi= Yo+hF(to, Vo) , ee; Ven = Ye hE(te, Vi) 2 à Ya Ya hF(tn 1 Ya) 


et Ÿ, est une valeur approchée de X(T). Pour |h| assez petit, l'accumulation des 
erreurs conduit à une erreur finale || X(T) — Y,|| de l’ordre de |h|. 

Voici une autre méthode numérique, inspirée de la méthode d’Euler, mais un peu 
plus précise et dont l'implémentation reste simple. 


La méthode de la moyenne pente 


Expliquons-la dans le cas d’une équation numérique x’ = F(t,x) : la solution x(t) 
est donc une fonction à valeurs réelles. En to, 


YA 
la pente de la solution est p = F(to,x0) et en —. 
Z] = TZ mr 
t1, la pente vaut à peu près q = F(ti,y1), avec : : 
Yi = &o + hp. Formons la moyenne m — — 


des pentes et utilisons m pour estimer une 


valeur 2, de x(t1), en posant & 


A = Xo + Àm 


On a 
4 = F(to + ha + hp) = F(to, 20) + AD (to, co) + APE (to, to) + PUR?) 
en notant p(h?) une quantité de l’ordre de h? quand [h| est assez petit. Il vient 
21 = T0 h3 Lo p + RE (to, &o) + RPÉE (to, %0) + p(h*) 
(1) 2 
= 20 + hp + . É L por] (to, To) + p(h°) 


On a aussi le développement limité 


alt) = (to + h) = vo + hp+ DS (s) + (fs) 


2 d 
Puisque 
er = 2 LF (4, x(t))] = C0) à LE (a(t))a/(#) 
on obtient ie (to) = [2e +p0E (to, To) et 
(2) a(t1) = 20 + hp + L [2e p2E) (to, To) + p(h®) 


En comparant (1) et (2), on voit que l'écart |x(t1) — z1| est de l’ordre de |Af. 
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En continuant ainsi de proche en proche, définissons les approximations 20,21,...,2n 
en posant 29 — Zo et 


ai = 2k + : [F(tx, 2x) + F(te41, 28 + hF(tx, 2#))] pour k=0,1,...,n—1. 


Par suite de l'accumulation des erreurs, l'écart final |x(T") — z,| est seulement, pour 
(h| assez petit, de l’ordre de h?. 


Algorithme de la moyenne pente 
L'algorithme suivant calcule une approximation de X(T), où X est la solution du 
système différentiel X’ = F(t, X) ayant pour condition initiale X (to) = Xo. 
initialisations : 

tt; Z+ Xo ; n:un entier positif ; h«< (T —to)/n 
itération : pour k de 1 à n, faire 

P<F(G,Z);s<t+h; Ye Z+RE(,Z) ; Q=F(8,Y) 

Z+ Z+(h/2)(P +Q) 

ts 
fin : Z est une approximation de X(T) : il y a une constante a telle que 
IX(T) — Z] < ee pour tout n assez grand. 


Il existe bien d’autres méthodes numériques plus précises pour estimer la valeur numé- 
rique d’une solution d’équation différentielle, mais les calculs sont plus coûteux. 


Application au tracé d'une courbe d'équation f(x, y) = 0 
Soit f une fonction de deux variables réelles, à dérivées partielles continues, et soit 
(C') la courbe d’équation f(x,y) —0. Supposons qu’on connaisse un point A—(x0,Y%0) 
sur (C'). D'après le théorème des fonctions implicites, on peut paramétrer la courbe 
(C') au voisinage de À, en prenant par exemple x comme paramètre si la dérivée par- 
tielle - n’est pas nulle en À. Il y a ainsi une fonction y(x) telle que f(x,y(x)) 0 
y 
pour tout x. En dérivant, on obtient 
of | of dy 
0x  Oy dx 


Ainsi y(x) est la solution de l'équation différentielle (où la variable est x) 


= 0 en tout point de (C'). 


, avec condition initiale y(xo) = yo. 


En utilisant une méthode numérique, on peut calculer une valeur approchée de y(x) 
et en traçant le graphe de cette fonction, on obtient l'allure d’un morceau de la 


of 


courbe (C'). S'il y a sur la courbe des points où Du — 0, l'équation différentielle 
y 
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@ 1. 


ND 


cesse d’être définie en ces points : le graphe de la fonction y(x) peut donc ne pas 
couvrir en totalité la courbe (C'). 


a Exercices mms 


é = a(r -c—£) 

Ê =b{r-c—£) 
l'exemple 2 page 479 qui modélise l’évolution des taux d'intérêts c et { à court et 
à long terme (les constantes a, b,r sont positives). Le domaine est c > 0 et £ > 0. 


Évolution de taux d'intérêts. Reprenons le système différentiel { 


a) Montrer que tout point du segment de droite d’équation c+£=7r,c>0,r > 0 
est un point d'équilibre et que si (c(t),{(t)) est solution, alors be(t) — al(t) est 
constant. En déduire que les trajectoires sont rectilignes. 

ar br 

a+b° a+b 

c] Calculer les valeurs propres et les vecteurs propres de la matrice du système. En 
déduire la solution générale. 


b) Montrer que la fonction constante (c,{)— ( ) est une solution du système. 


dj Soit S(t) = (c(t),{(t)) la solution ayant pour condition initiale % sé 
c(0) = €, £(0) = Lo, où co et Lo sont des nombres positifs. Cal- a 
culer S(t) et montrer que S(t) tend vers le point d'équilibre ec 
l 
a +b 
trer que chaque point d'équilibre est stable, mais pas asymptotiquement stable. 


(bco—alo + ar, —bco+alo + br) quand t tend vers +00. Mon- dx 


e) Justifier le dessin ci-contre des trajectoires, où l’on a choisi a=—2/3, b=1/3 et r—20. 


. Un système de ressorts. Dans l'exemple 1 page 478, prenons des masses unité et des 


ressorts de raideur k1 = 1, k2 = 2 et ka — 4. Le système différentiel s'écrit X’ = AX, 


0 010 
. à | COL 
où A=]|_3 200 

2600 


a) Montrer que les valeurs propres de À sont +V2 et +17. 


b) Calculer une base de solutions et montrer que le mouvement des masses est donné 
æ(t) = acos(V2t) + bsin(Y2t) + ccos(7t) + dsin(7t) . 
Per { æo(t) = : cos(V2+t) + : sin(V2+t) — 2ccos(v7t) — 2dsin(V7t) Eau ee 
sont des constantes. 
d À l'instant t—0, on maintient la masse mo à l'équilibre et l’on écarte m1 
de la quantité algébrique a 0. Montrer que le mouvement est donné par 
_ — Ssmv2t+ 5 cos V7t et _ — 2 sin 24 ce 2 cos VT7t. Ces mouvements sont-ils 


périodiques ? (procéder comme dans l'exercice 5 page 294). 
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3. Ressorts en anneau. On enfile trois ressorts identiques sur un anneau circulaire ri- 
gide R placé horizontalement, chaque ressort ayant 
pour longueur un tiers de circonférence. Appelons 
A0, Bo, Co leurs extrémités. Quand on abandonne 
le dispositif après avoir comprimé un ou plusieurs 
ressorts, les extrémités des ressorts ont des mou- 
vements A(t),B(t),C(t) qu'on repère par les arcs 
orientés x ="AÀ, y = BB et z— Ce. 

a) Notons 1, {2,3 la longueur des ressorts AB, BC, CA. Montrer qu'à tout instant, 
on à æ+li — y = y+lo—z = 2+l3-x. 

b) Montrer que à — —k(L—{1) + k(L—4{3) = —-k(2x-y-—2), où k est la raideur des 
ressorts et L le tiers de la circonférence. Écrire les égalités analogues pour ÿ et À. 


€) Supposons k=1 et posons u= à, u=ÿ, w— 2. Écrire le système différentiel linéaire 
X'— AX aux six inconnues +,y,z,u,v,w. Montrer que la matrice À possède trois 
valeurs propres doubles 0, à V3 et —i V3. 

d) Supposons que les positions initiales sont données par x(0) = 0,y(0) = b,z(0) = c 
et qu’on abandonne les ressorts sans vitesse initiale. Montrer que les solutions 
sont z(t) = p[1- cos(V3t)] , y) = p+ D. cos(V3t), z(t) = p+ + cos(V3t), 


3 
où p— 2e. Les mouvements des points À, B,C' sont-ils périodiques ? 


@ 4. Second membre exponentiel. Soit un système différentiel linéaire X’— AX + B(t), où 
À est une matrice constante de taille n. 


a) Supposons que B(t)—e%V, où V est un vecteur constant et & un nombre qui n’est 
pas valeur propre de À. Montrer qu’il y a un unique vecteur Ÿ solution de l’équa- 
tion linéaire (al, — A)Y = V et que e%Y est une solution du système différentiel. 

b) La diffusion d’une certaine substance s entre trois compartiments tissulaires (1), (2) 

—21/2 1 
et (3) est modélisée, en régime libre, par le système X'=AX, où A— | 


Initialement, les compartiments ne contiennent pas s. À l'instant { — 0, on injecte 
s dans le compartiment (1) selon la loi de diffusion pe”? + get, où p et q sont 
des quantités positives. Montrer qu’à l'instant {, la quantité de substance s dans 
le compartiment (2) est y(t) — : [2p+q — 3pe-* — 3qe * + (p+2q)e *]. 

Quelle est l’allure de la courbe y(t) pour t > 07? 


@ 5. L'équilibre proies-prédateurs. Considérons le système proies-prédateurs étudié page 501. 
a) Calculer le linéarisé du système au point d'équilibre (0,0) et justifier la forme des 
trajectoires autour de ce point. 
b) Calculer le linéarisé (L) : X'— AX du système au point d'équilibre E —(c/d,a/b) 
et montrer que le système n'est pas linéarisable en ce point. 
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c) Quelle approximation peut-on prendre pour une solution de condition initiale voi- 
sine de E£ ? Montrer que la période des petites oscillations autour de Æ est à peu 
près 27//ac (voir le paragraphe 4). 


@ 6. Dépendance des paramètres. Considérons le système compartimental formé du tractus 

intestinal (G) et du sang (S) : les transferts de 

substances de (G) vers (S) et de (S) vers le ü ; 

système rénal (R) sont régis par la loi d'action . (are) pe ee 

de masse : { . = ni , où a et b sont des (G) (S) (R) 

paramètres positifs tels que b > a. 

a) On suppose qu’à l'instant £—0, on a G(0) = g9 >0 et S(0) —0. Calculer la solution 
(G(t), 5(t)). Montrer que G(t) et S(t) tendent vers 0 quand + tend vers +oo et 
que l'équilibre (0,0) est asymptotiquement stable. 


b) Les fonctions de sensibilité au paramètre a sont x(t) — ns et y(t) = œ. Montrer 
a (2 


& = —-ax-G(t) 
y =ax-by+G 


x(t) = —-gote %* et y(t) — Tant IL a(b—a}t]e” tt — et]. 


que ces fonctions sont solutions du système { OU Montrer que 


cd On veut estimer le paramètre de diffusion a en mesurant la quantité S par des 
analyses sanguines. On aura une meilleure précision si l’on effectue ces mesures 

à un instant où a dépend le moins de #, c’est-à-dire lorsque la valeur absolue 
Oa 


os 
b est proche de 1,5. Pour ces valeurs, faire dessiner par ordinateur le graphe de 


y(t) entre 0 et 6. Constater qu'il vaut mieux faire les mesures vers l'instant t —3. 


est minimum. Supposons que la valeur de a est proche de 1 et que celle de 


@ 7.Un exemple de compétition animale. Le système suivant modélise une compétition 
brutale entre deux populations animales d'effectifs x et y (l'unité est la dizaine 
d'individus) : 7 — 2 

ÿ = a(y-y — xy) 
surpopulation et —xy traduit les contacts mortels entre individus d'espèces différentes. 


, où a > 0. Le terme —ÿ reflète une mortalité par 


a) Trouver les deux points d'équilibre à coordonnées positives ou nulles. Montrer que 
le demi-axe des y Z 0 est réunion de quatre trajectoires. Montrer que le demi-axe 
x > 0 est une trajectoire : quelle sont les solutions (x(t),0) correspondantes ? 


b) Montrer que les droites d’équation y =2 et x+y=— 1 divisent le domaine 
D={(x,y)|x > 0 et y > 0} en trois régions dans lesquelles à et y ont des signes 
constants. On note (À) la région y > 2, (C) la région x+y < 1 et (B) la troisième 
région. Dessiner la direction du champ en tout point d’une frontière de ces régions. 

c) Montrer que toute solution qui part d’un point de (A) ou d’un point de (C') rentre 
dans la région (B). Montrer que toute solution qui est dans (B) à un certain 
instant reste ultérieurement dans (B). 
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@ 10. 


d) Montrer que pour toute solution, on a Jim x(t) = +00. En déduire que y(t) a 
—+00 
une limite finie comprise entre 0 et 2 quand t tend vers +00. 


e) Montrer qu'il existe un instant T' tel que l’on ait y(t) < —y(t) quel que soit t >T. 
En déduire que y(t) tend vers 0 quand t tend vers +00. 

f| Faire un dessin des trajectoires. 

g) On suppose a = 1. Soit (æ(t),y(t)) la solution telle que x(0) = 2 et y(0) = 5. On 
considère que la population y est éteinte lorsque y/x < 0,05. En faisant calculer 
numériquement les fonctions x(t) et y(t) par un ordinateur, montrer que le temps 
d'extinction de y est environ 1,19. 


. L'équation de Van der Pol. Il s’agit de l'équation différentielle (P) : y" =—y-y + y". 


Écrire le système différentiel du premier ordre associé. En utilisant un 
ordinateur, vérifier que les trajectoires ont l'allure ci-contre. Expliquer 
comment, par ce dessin, on peut se convaincre qu'il y a une solution 
périodique. Cette équation a été utilisée pour les premières modélisations du 
fonctionnement cardiaque. 


! —_ r 
. Utilisation de la formule de Stokes. Soit le système différentiel . = f(x,9) , défini 


y = g(x,y) 
dans un domaine D (les fonctions f et g ont des dérivées partielles continues). Si 
R est une région de D limitée par une courbe fermée ©, la formule de Stokes (page 
; ; : : Of Ôg 
430) affirme que l’on a LF(,9) dy—g(x, y) dx = AE CP) dx dy. 
a) Supposons que (x(t),y(t)) est une solution périodique du système différentiel 
et que C' est sa trajectoire. Montrer que, dans la formule de Stokes, l'intégrale 
curviligne est nulle. 


b) Supposons que le champ de vecteurs E— [f(x,y),g(x,y)] a une divergence de signe 
constant dans D. Montrer que le système différentiel n’a aucune solution périodique. 

Ds 

Ÿ = —sin0 — av +b 

où les constantes a et b sont strictement positives (page 514). Montrer que la 

divergence du champ est —a. En déduire que dans le cylindre des phases, toute 

trajectoire fermée doit faire le tour du cylindre. 


c) Considérons le système différentiel { du moteur électrique, 


s 


Étude d'un équilibre. Soient a(x) et c(x) des fonctions à dérivées continues, définies 
x! = xa(x) + by 


sur un intervalle autour de 0. Considérons le système différentiel 4 ‘, , 
y = æc(x) + dy 


où b et d sont des constantes. 

a) Montrer que l’origine O = (0,0) est un point d'équilibre et que le linéarisé du 

a(0) | 

c(0) d | 

b)En déduire que si l’on a a(0)d—bc(0) > 0 et a(0)+d < 0, alors l’origine est 
asymptotiquement stable. 


système en ce point a pour matrice | 
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c) Supposons que pour tout x assez voisin de 0 et différent de 0, on a 
a(x)d—bc(x) > 0 et a(x)+d < 0. Supposons de plus bÆ£0. Posons V(x,y) = 


> (dx by)? + [ [a(s)d—c(s)b]s ds. Montrer que V est une fonction de Liapounov 


pour l'équilibre O et que cet équilibre est asymptotiquement stable. 


L 


= 


. Contrôle d'une cuve à mélanger. Considérons une cuve mélangeuse contenant un sol- 
vant et alimentée par deux solutions de concentrations c et 

c>, avec des débits réglables 61 et 02. Soit V(t) le volume nN & p” 
de liquide dans la cuve à l'instant t, ô(t) le débit de sortie 

et c(t) la concentration du mélange dans la cuve. 


Les bilans en volume de solution et en masse de produits 
dissous s'expriment par 


d 
av — 01+02—0 et see = C101 + C202 — CO. 


De plus, si S'est la section de la cuve, alors d’après la loi d'écoulement de Bernouilli, 

on a Ô — aVV (où la constante positive a est de la forme b/ VA ). 

a) Montrer qu’un état d'équilibre est caractérisé par un volume constant V2 dans la 
cuve ainsi que par des débits 01 = ôje, 02 = dre, 0 = à. et une concentration en 
sortie c = c. vérifiant les égalités 0, = d.+02 et Cede = C101e+C202e. 

b) Pour linéariser le système autour de l'équilibre, introduisons les différences 
x = V-V, et y = c—c et les commandes u — 01—03e, 0 — Ü2—02e. 

{il Montrer que pour x petit, on a au premier ordre l’approximation 


ri (14,2) | 


ü) En déduire les approximations 


TUE Lu dboy et ÿ= | 


T = 
2VVe Ve 


a C1 —Ce — Ce 2 
, = et @2 = ——<. Montrer que le linéarisé du 
2V/V. ve ve 


à ; PR T — Ofx 1 1]fu 
système au point d'équilibre est (L) : FH _ | ‘ : 1] + le | [| 
c) Calculer la matrice de commandabilité de (L). En déduire que le système (L) est 
commandable par (u,v) si et seulement si les concentrations c1 et c2 sont diffé- 
rentes. Justifier l'affirmation : «dans le cas «1 Z ©, si deux états (V,c) et (V’,c) 
sont proches de l'équilibre, on peut passer du premier au second en agissant sur 
les débits 0 et 02.» 


u+v+0e] + V [cu + cou + cd]. 


C2 


li) Posons p = 


d) Soit la matrice K — Lo k |: Calculer la matrice À — BK et son polynôme carac- 


téristique. On suppose « Æ © et l’on pose k = £/(2a2), où € = 1 si a—a > 0 


et € = —1 si aa < 0. Montrer que le système (5 ] = (A- BK) M est un 
bouclage stabilisant de (L). 
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@ 12. Soit X'— f(t, X) un système différentiel où la fonction f a des dérivées partielles 
continues. On suppose que f est périodique de période T' par rapport à la variable 
t, autrement dit f(t+T,X) = f(t, X) pour tous t et X. 
Montrer que si tr X(t) est une solution, alors la fonction t- X(t+T') est solution. En 
déduire que s’il existe t, tel que X(t0)=X(to+T), alors la fonction X({) est périodique 
de période T (comparer les conditions initiales des solutions X(t) et X(t+T)). 
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Chapitre 17 


Séries, séries entières, 
séries de Fourier 


1. Séries numériques 


Étant donnée une suite de nombres uz réels ou complexes, on doit parfois considérer 
les sommes 56 = Uo , S1 = Uo + 1 , 82 = Uo + Wi + 2 et de manière générale, la 
somme d’un nombre quelconque de premiers termes : 


nm 
= ++ +us = ÿ ux 
Dee eue k=0 
Définition 
Les sommes s, forment une suite, appelée série de terme général ux et notée Du. 
Chaque somme s, s'appelle une somme partielle de la série. 


Si les ux ne sont définis que pour k > p, les sommes partielles sont 


LOU] 
Up y Up + pi ce à Up + Up + + Un = ) ux pour tout n > p. 
k=p 
On s'intéresse surtout aux cas où les sommes partielles forment une suite convergente. 


Définition 

Si la suite s, a une limite s, on dit que la série Su, est convergente. Dans ce cas, le 

nombre s s'appelle la somme de la série et se note s— Li. ur, où p est le premier 

indice de définition des uz. Les nombres r, —s—s, s'appellent les restes de la série. 
Si des séries ÿuy et Du, sont convergentes de sommes s et s’, alors la série 5 (ux+u;,) 
a pour somme s+5/, et pour tout nombre À, la série (Aux) a pour somme Xs. 


Par définition, une série à termes complexes est convergente si et seulement si la série 
des parties réelles et la série des parties imaginaires sont toutes deux convergentes. 


Proposition. Si une série D ux est convergente, alors lim ux = 0. 


k—+00 
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Démonstration. En effet, en supposant que la suite des u, commence à l'indice O0, on a 
Sn — S$n—1 = Un pour tout n > 1.Si les sommes s, tendent vers s, alors la différence s,, — s,,_; 


tend vers s—s — (. = 


Dans le cas d’une série Sux à termes ux réels positifs ou nuls, les sommes partielles 
sont croissantes puisqu'on à $,+1—S» = un Z0 pour tout n. Comme une suite croissante 
de nombres réels est convergente si et seulement si elle est majorée (page 261), on en 
déduit le résultat suivant. 


Théorème. Une série Dux à termes ux > O est convergente si et seulement si ses 
sommes partielles sont majorées. 


Théorème de comparaison. Soient D ux et D vx des séries à termes réels. Si l'on 
a OL ux Lux pour tout k et si la série D vx converge, alors la série S'ux, converge. 


Démonstration. Chaque somme partielle de la série Dux est inférieure ou égale à la somme 
partielle correspondante de la série 5 'v,. Si cette dernière série converge, ses sommes partielles 
sont majorées, donc aussi les sommes partielles de la série Su, qui est donc convergente. 5 


1.1 Les exemples fondamentaux 


Séries géométriques 
Supposons que les ux a une suite géométrique : si a est le premier terme et z 
la raison, on a donc ux = az* quel que soit l’entier k > 0. On dit que la série D az} 
est une série géométrique. Les sommes partielles sont (remarque page 46) 
b _,n+1 

Sn = 4% +az +a+...+a =al+z+z+...+2" = a — 
Proposition. Supposons a70. La série géométrique D az" est convergente si et seulement 
k_ a 

1-2 


si |z| < 1 et dans ce cas, sa somme est 5% az 


n 


Démonstration. Si || <1, alors |2"| —|2|" tend vers 0, donc aussi z" : quand n tend 


— 1-0 7 
vers +00, les sommes s, ont alors pour limite a = = et la série est convergente. 
—2 —2 
Réciproquement, si la série D az* converge, alors nécessairement son terme général az* tend 
k] _ 


vers 0 quand k tend vers +co, donc aussi les modules |az lal|z|* ; puisqu'on a supposé 


a Z 0, |z[F tend vers 0 et cela implique [z| < 1. = 


Majoration du reste lorsque |z| < 1. En notant s la somme de la série, on a 
zv+i znti . & . . 
Sn = $—Q Fa donc le reste est r, —=s—-s,—a La” D'après l'inégalité triangulaire 


: lal 
1 [2 


£ |21+/1-2|, on a [1-2] > 1-|2, d'où la majoration |r,| < |21"*T qui est 


d'autant plus petite que n est grand. 
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Séries de Riemann 
I Définition 


Soit & un nombre réel positif. La série ÿ° _ s'appelle une série de Riemann. 


Pour étudier la convergence, nous allons estimer les sommes partielles ++ : ++ 
nm 

en les comparant à une intégrale de la fonction x + _. 
TX 


œ 


Proposition. Soient p>0 un entier et f :[p,+oo[—R une fonction continue positive et 
décroissante. Alors la série 9° f(k) est convergente si et seulement si l'intégrale généralisée 


+ 
| L f(€) dt existe. Dans ce cas, on a l'encadrement 
P 


fOa< SF < FE) + .  f(6) at. 


p k=p 


Démonstration. Pour tout entier k > p, posons ux — f(k). Si t est entre deux entiers k et 
k+1, alors on a ux+1 = f(k+1) < f(t) < f(k) = ur, car f est décrois- 


nie Pre RTL u 
sante. En intégrant sur [k,k+1], il vient donc uy+1 < Î fdieus. 
Ajoutons ces inégalités pour k = p,p+1,...,n; on obtient : Sn f 
n+1 Un ‘ 
Up+1 + Upt2 +: +Unti < FE) dt up + Up41 +: + Un 5 RAT à 
P 


Le terme de droite est la somme partielle s,, de la série Du, de premier terme u, et celui 
de gauche est $,,1 — u,. L'encadrement se récrit ainsi sous la forme 


(x) LT SO dt < sn <up + [9 FE dt 
où l’on a changé n+1 en n pour avoir l'inégalité de droite. Supposons que l'intégrale générali- 


+oe Lo 
sée 1 = J f(£) dt existe : par définition, I est la limite des intégrales F. f(t) dt quand n tend 
p P 


mn 
vers l'infini. Puisque la fonction f est positive, on a | f(t) dt £T pour tout n, donc les sommes 
P 


partielles s, sont majorées par le nombre u,, + 1. D'après le théorème précédent, la série 5 ux 
converge. Réciproquement, si la série converge, ses sommes partielles sont majorées par la 


n+1l 
somme s de la série et les intégrales | f(t) dt sont, d’après (+), majorées par s. Il s'ensuit 
p 


T 
que l’on a Î f(t) dt £ s pour tout x > p et par suite, l'intégrale généralisée existe. En passant 
P 


à la limite dans (+) quand n tend vers l'infini, on obtient l'encadrement pour la somme s. 8 


+00 
On sait que l'intégrale généralisée Î de dt existe si et seulement si à > 1 (page 325). 
1 


D'après la proposition, c'est aussi la condition de convergence de la série de Riemann 
1 
DL. 


1 


Proposition. La série de Riemann Y° = 


est convergente si et seulement si à > 1. 
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Majoration du reste. Si la série satisfait les hypothèses de la proposition, l’enca- 
drement donné permet de majorer le reste r, — s —s, pourvu qu’on puisse majorer, 


+ 
en fonction de n, l'intégrale généralisée ‘I . f(6) dt. 
nm 


Exemple. Considérons la série de terme général ux — —. où a > 0. La fonction 

a 

f(x) = ne est positive et décroissante sur [0,+c{, donc pour tout entier p > 1, 
a A 


on a la majoration +00 


+00 
Ds <u+t | À. 
k=p 4 +k p  à+t 
: dt L x 1 + dt lÎir D 
Puisque | — — — Arctan —“ (page 298), il vient Hi = 1]7 - arctan E | 
q + a a (pag Av Î a+  alL2 a 
Mais d’après la relation tan (Ze) =, ona Z — Arctanx = Arctan À pour 
2 tan 0 2 x 
+00 
tout x > 0. Aïnsi, F ne 5 = L'Arctan € et 
p a" +t a p 
+00 
+. _ = a + L'Arctan €. 
—< a +k a°+p a P 


Cette majoration du reste permet un calcul approché de la somme de la série, car le 
membre de droite M, tend vers 0 quand p tend vers l'infini : si l’on trouve un entier 
p > 2 assez grand pour que M, < €, alors la somme partielle u1+u2+---+u,-1 est 
une valeur approchée par défaut à € près de la somme D} % uy. 


Séries d'Abel 


Il s’agit des séries à termes complexes de la forme ÿ'age*"*, où le nombre x et les 
ax sont réels. La série converge si et seulement si chacune des séries az sin kx et 


k 


Jar cos kx est convergente. On a le résultat suivant, dont nous verrons des exemples 
dans le cadre des séries de Fourier. 


Proposition. Si la suite des ax est décroissante, positive et tend vers 0, alors la série 
Sax sin kx est convergente pour tout x et la série Sax cos kx est convergente au moins 
pour x non multiple entier de 27. 


Exemples 
- Séries alternées. En prenant x 7 , on a cos kx — cos kr — (—1)* pour k entier. 


Si les ax sont positifs, décroissants et tendent vers 0, la série ÿ (—1)"ar 


est convergente. 


(-D° 


Une telle série est dite alternée. Ainsi la série alternée ÿ° 


1) 
de même que ÿ° es pour tout nombre a > 0. 


est convergente, 


sin £x 


Si a > 0, la série S° = 


est convergente quel que soit x. 
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Mode de convergence d'une série alternée. Les sommes partielles sont 


Sn = A0—@1+02—Q3+a4—a5+ + + (—-1)'an 


On a 
S2—S0 — —@1+@2 < 0 y S4A—S2 —= —&G3+@a < 0 y S9n — S92n—-2 — Aon—1 t on < 0 
83—81 = G2—G3 20, S5—S3 = G4—-Q5 20 , Son+1—S2n-1 = A2n —Q2n+1 2 0 
Les sommes 51,53,55,... forment une suite croissante, les sommes 56,52,84,... une suite 


décroissante, et la différence 52» —s2»-1 — a2, est positive et tend vers 0 : ainsi la suite 
des 5-1 et la suite des 52, sont adjacentes, donc elles ont la même limite s (page 
261) : cela démontre qu'une série alternée est convergente. De plus, on a l'encadrement 
San-1 < S < S2, pour tout n>1letp> 0. 


La somme d'une série alternée est toujours comprise 
entre deux sommes partielles consécutives quelconques. 


Majoration du reste d'une série alternée 
En appelant s la somme de la série, on a Ü< s—s2»_1 < Son —S2n_1 = G2n et OK S2n—8< 


S2n —S2n+1 — A2n+1: 


Dans une série alternée, le reste est, en valeur absolue, 
inférieur au premier terme négligé. 


1.2 Critères de convergence 


Proposition et définition. Si la série 3° |u| est convergente, alors la série D 'ux est 
< D url. Dans ce cas, on dit que la série Dux est 


convergente aussi et [5,% ur 
absolument convergente. 


Démonstration. Notons ax la partie réelle de ux et bx la partie imaginaire, de sorte que 
ur = ar +èbr. On sait que [ax] < [urk| et [bx| < [ux|. Si la série Su] est convergente, alors 
d’après le théorème de comparaison, il en va de même des séries Sa] et 5|b;|. Puis- 
qu'on a 0 < ax] — ax < 2|a|, la série de terme général dx = |ax| — ax est convergente. On 


a Dax = D _|ax|-Y dx, donc la série Sax est convergente. De même, la série SD est 


convergente et il s'ensuit que la série D (ax +4bx) = Sur est convergente. 
Pour toute somme partielle 8, = YF ur, on a [sn] < D %_,lur| car le module d’une somme 
est inférieur ou égal à la somme des modules; par suite, 


+oo +oo 

) ux| =| lim s,[= lim |s,|< ) lux] . = 
n— +00 n— +00 

k=0 k=0 


En appliquant le théorème de comparaison, on en déduit le premier critère suivant. 


Critère de comparaison. Si l'on a |ux| < vx pour tout k assez grand et si la série 
Der converge, alors la série Sux est absolument convergente (donc convergente). 
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Exemples 


A? 
k 


La série alternée ÿ° 


Er 


est convergente, mais elle n’est pas absolument conver- 


= L est le terme général d’une série de Riemann non convergente. 


À Cu 


De même, la série 


gente, car 


est convergente, mais pas absolument convergente. 


ikæx 
Si a > 1, la série ÿ° FT est absolument convergente pour tout réel x : en effet, 
ikæx 
on a = | = L et la série de Riemann ÿ° est convergente. 


Proposition. La somme de deux séries absolument convergentes est absolument conver- 
gente. 


On a en effet Jux+ur| < [ur|+lur 
D (luxl+luxl) converge et, d’après le critère de comparaison, il en va de même de 
> lux+vel. 


. Si Dlux| et D [ur] convergent, alors leur somme 


Critères de convergence pour les séries à termes réels positifs 
Supposons u4 > 0 pour tout k. 


a) Si l’on a Uk, TUE et si la série D vx converge, alors la série S'ux converge. 
—+00 


b) Supposons que #/ux tend vers une limite finie L. Si £ < 1, la série Dux converge; si 
© > 1, la série ne converge pas. 


c) Supposons que = tend vers une limite finie £. Si { <1, la série Jux converge; si 
Uk 
{> 1, la série ne converge pas. 


Montrons le premier critère. Supposons lim (ux/vx) = 1. Choisissons un nombre {! > 1. 
Pour tout k assez grand, on a wx/ux < l', donc ux < lux car vx est positif pour k 
assez grand. Si la série S'y converge, il en va de même de la série ÿ[(//v;), donc, 
par le théorème de comparaison, la série S[ux converge. 

Pour le deuxième critère, supposons { < 1 et choisissons un nombre {’ tel que { < L’ <1. 
Par hypothèse, on a {/ux < {' pour tout k assez grand, donc ux < l'*. La série géo- 
métrique 37 /’* a sa raison de module strictement inférieur à 1, donc est convergente. 
D'après le théorème de comparaison, la série ÿ'ux est donc convergente. Supposons 
maintenant { > 1. On a alors {/ux > 1 pour tout k assez grand, donc aussi u4 2 1 et 
ux ne tend pas vers 0 : la série n’est donc pas convergente. 

Raisonnons de même pour le dernier critère en supposant d’abord { < 1. Pour tout k 


Uk 

supérieur ou égal à un certain indice K, on a — < {'. En multipliant ces inégalités 
eue : | u 

pour k=K,K+1,-...,K+4n, on obtient Pr <{", donc uxin <uxl" pour tout 


n > 1. Comme la série géométrique de raison L£’ est convergente, il en va de même, par 
comparaison, de la série Sur. Si {> 1, alors on a ux+1 > Uk pour tout À assez grand, 
donc u} ne tend pas vers 0. 


Exemples 


k 
— La série ÿ° FT est absolument convergente quel que soit le nombre complexe z. 
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lueil _[eËtt | ll 

lux | 2% (k+1)! k+1 
quand k tend vers +00. On en déduit que la série 5° |u;| est convergente, autrement 
dit : la série D ux est absolument convergente. 


tend vers 0 


k 
: y Z 
En effet, si l’on pose ux — %r' alors 


- Soit q un entier quelconque. Si z est un nombre complexe tel que |z| < 1, la série 
Yk12zF est absolument convergente. 


|| tend vers |2| quand k tend vers 


q 
En posant u, = k12", le rapport lux = | Et, 


lux | 
+oo. Si |z| <1, la série S'|u;| est convergente, donc ÿu; est absolument convergente. 
— La série ÿ° me n'est pas es car son terme général est équivalent 
+ 


s 


à F et la série — Riemann De = n’est pas convergente. 


k 1 
La série a de 
2 rs 7 VE 7 P( 
— Si P et Q sont des polynômes non nuls tels que degQ— deg P > 2, la série Ÿ° QU) 
est convergente. 


est nn car 


En appelant p et q les degrés de P et Q, on a P(k) = ak? et Q(k) = bkf, où a 


P(k 
et b sont les coefficients dominant des polynômes. On en déduit au) ee 


i QU) br 
série de Riemann ÿ° EP est convergente si et seulement si g—p > 1, c'est-à-dire si 


et seulement si g—-p > 2, puisque p et q sont des entiers. 


Séries entières 
Définition 
Une série de la forme + dr, où z est un nombre réel ou complexe, s'appelle 
une série entière. 


Les sommes partielles de la série entière 5 a;z" sont les expressions polynomiales 
Sn = G0+412+022?+ -..+anz?, car par convention, on pose A = 1. 


Exemples 
La série S 2 LL” de sommes partielles Sn —= are + +2 nl’ est une série entière. 


Z2n—l . 
est une série 


De même, la série de sommes partielles s,, = 2+ + 2 +. +2 


entière S'agz : ses coefficients sont définis par = = 0 pour k2>0 et @x_1 = 1/k 
pour tout k 21 


Une série entière D az" converge toujours pour z = 0. Considérons l’ensemble 7 des 
nombres réels r > 0 DURS lesquels la série 32 [ax|r* converge. Soit r € J et soit r’ un 
nombre tel que 0 £r’< r; la série lag|r* converge et puisqu'on a lagtr'F < lagfr*, 
la série 5 |ag|r'* converge aussi, donc r’ € 1. Cela montre que si r € 1, alors I contient 
l'intervalle [0,r]. On en déduit que Z est un intervalle de la forme [0, R] ou bien [0,R], 
R pouvant, dans ce dernier cas, être le symbole +co. 
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Supposons par exemple que À est un nombre réel. Alors pour tout nombre complexe z 
tel que 0 <|z2| < A, la série D |axz*| = D |ax||2|* est convergente, donc la série entière 
SX axz* est absolument convergente. 

Montrons que si r > À, la suite axr* n’est pas majorée. Raisonnons par l’absurde en 


supposant qu’il existe un nombre M > 0 tel que [axfr* < M pour tout k. Choisissons 


k k 
un nombre p tel que R<p<r. Ge a alors |az|p* = |az|r* (5) < M (5) et comme 
Ê < 1, la série géométrique (5) est convergente. Il s'ensuit que D |ax|p* est conver- 


gente, ce qui est impossible puisque p > R. 
On en déduit que si r > R, la suite az" ne tend pas vers 0 : pour r > R, la série 


Yaxz* ne converge pas. 


Théorème et définition. Soit 5 az;2* une série entière. 
> Ou bien la série est absolument convergente pour tout z et l’on pose dans ce cas R— co, 
ou bien il existe un nombre réel R > 0 tel que la série est absolument convergente si 


ll <_R et non convergente si |2| > R. 


R s'appelle le rayon de convergence de la série entière D ax.2". 


Supposons que le rayon de convergence À est un nombre. Si |:| > R, la série ne 
converge pas, donc ne converge pas absolument. Le rayon est donc caractérisé par 
la propriété suivante : si |2| < R, il y a convergence absolue, et si |z| > R, il n’y a 
pas convergence absolue. 

Si l’on a trouvé un nombre R tel que la série converge absolument pour 

ll <_R et ne converge pas absolument pour |2| > R, alors le rayon de 

convergence est égal à R. 


Calcul du rayon de convergence. Soit 5 az,2" une série entière dont les coeffi- 
cients ax sont non nuls. 


. [4k+ 
Si | a L tend vers 0, alors le rayon de convergence est R = ©. 
ak 
. lap+ 1 
Si la al a une limite finie { > 0, alors le rayon de convergence est . 
laxl l 
à . u a ke 
Démonstration. En posant uy = a,2*, il vient | Le _ | it |z|. Supposons que | ne 
Uk ak ak 
Uk 
une limite finie {, donc | ie tend vers {|z|. Appliquons le critère de convergence (c]. Si {—0, la 
UE 


série 5 |u4| converge quel que soit z, donc le rayon de convergence de D axz* est R=0o. Si />0, 
cette série converge pour {|z|<1, c'est-à-dire pour |z|<1/£, et elle ne converge pas pour |21>1/£ : 
d’après la règle ci-dessus, c’est donc que le rayon de convergence de D axz* est R = 1/4. m 


Exemples 


k 
— La série entière Ÿ " est absolument convergente pour tout z, donc son rayon 


de convergence est 00. 
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2 [ax +1 | 


k 
= 2 tend 2. L 
E Tax per tend Vers e 


k 
- Pour la série entière 52 ah, on à x = 
rayon de convergence est donc 1/2. 


Pour z = 1/2, on obtient la série de Riemann ÿ° i qui n'est pas convergente. 


1) 
Pour z = —1/2, on obtient la série 5° es qui est une série alternée convergente, 
mais pas absolument convergente. 


Ainsi, lorsque 2 parcourt l’ensemble des nombres complexes de module À, la nature 
de la série dépend de 2. 


2h 

Considérons la série entière S° = . Puisque les coefficients des puissances im- 
. . k 1 . 22h 

paires de z sont nuls, étudions la série de terme général uy — On a 


k?+1 


uk+1| k?+1 : ; Je 
| = . 12/7, expression qui tend vers |z|?. La série est donc absolument 


ll k?2+2k4+2 
convergente si |2] < 1 et n’est pas absolument convergente si |2| > 1 : on en déduit 
que le rayon de convergence est 1. 


Convention : Si r est un nombre réel quelconque, nous convenons que l’on a r < co, 
donc aussi min{r,oo}=r et max{r,oo} = 00. On pose également min{o,00} = 00 = 
max{00, co}. 


2.1 Opérations sur les séries entières 


Série somme et série produit 


étant données deux séries entières D az2" et 5bz2", la série 5 (az-+bz)2" est une 

série entière, ainsi que D (Aax)z* pour tout nombre À. 
Soient À et R' les rayons de convergence des séries entières Dagz* et Dbyzl. Si z 
est un nombre complexe tel que |z| < R et |z|] < R', chacune des séries est absolument 
convergente, donc aussi leur somme Y(ax-+bx)2*. On en déduit que le rayon de con- 
vergence de la série D (ax+bx)z"* est au moins égal à min{R, R'}. Si À est un nombre 
non nul, les séries Dazz* et 3(Aax)z* convergent pour les mêmes valeurs de z, donc 
elles ont même rayon de convergence. 


Définition 
Soient 3_azz" et 5_bxzF des séries entières. Leur produit est la série entière ar. 
où Cx = Qobx+@bx 1+": +ax 1b1+axbo. 


Le coefficient cx est celui qui est en facteur de 2* dans le produit 


(ao+a1z+ ag )(bo+b12+ : - : +bx 2) 


des k-ièmes sommes partielles. Pour calculer c;, on développe donc ce produit en sup- 
primant toutes les puissances de z supérieures à k, comme dans un développement 
limité. 

Soient Sa," et 5 b42* des séries entières de rayon À et R!. 
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k 


La série somme 32 (ax+bx)2" et la série produit D cx2* ont un rayon de convergence 


supérieur ou égal à p = min{R, R'}. Pour |z| < p, on a 


+00 +00 +00 +00 
Ÿ_ (ax+br)2" Yu + Smet et S 62" = (Sax!) (Sue) 
k=0 k—0 k—0 k—0 k=—0 


Propriétés de la somme d'une série entière 


Soit 5 axz* une série entière de rayon de convergence À > 0. Sa somme f(z:) est 
définie si le module de z est strictement inférieur à R, autrement dit 


la somme d'une série entière de rayon R > 0 est une fonction définie sur le disque 
ouvert D(O,R) = {2€ C|]|2| <_R}, qu'on appelle le disque de convergence. 


Quand on s’en tient à des valeurs réelles de la variable, la somme de la série est 
définie dans l'intervalle ouvert ]—R, R|. 

Les propriétés de la somme f(z) reposent sur l'existence d’une même «série majo- 
rante » lorsque |z| décrit un segment [—r,r] inclus dans |—R, R| : 


Si r est un nombre tel que 0 <r<R, il existe une série géométrique convergente br 
où 0 <b<1, telle qu’on ait |[az2*| £ Mb} pour tout k et pour tout z vérifiant |z| < 


Choisissons en effet p tel que r < p < R. Puisque p < R, la suite |az|pF tend vers 0, 


donc on peut la majorer par un certain nombre M. Si |2|] <r, alors on a 


.\E è 
laxzF| < laglr* = |ag|p" (5) < Mb, avec b = à & 1: 


En utilisant cette propriété, montrons par exemple que la fonction f est continue en 
tout point z du disque de convergence D. 


Pour 2€ D,ona f(2)-f(20) = Xar(2"—2#). Puisque |az||2*—2%|<lax||2l*+laxl|2olf, 
la série >} % % larl|z*—2$| est convergente, d'où 
+oo 
@)  |fG@)- < Slt — x = Slt —26l+ D laxllz-26l 
k=K+1 


Prenons r tel que [20] < r < R. Un nombre € > 0 étant donné, commençons par choisir 


un entier X tel que j%,, MbF <e/2, ce qui est possible puisque la série 3: Mb* 


converge. En utilisant à nouveau l'inégalité |2*—2k] < |2[*+/2/F, il vient pour |z| <r : 
+oo +00 +00 
(2) = laz| 272$] < w. 2ax|r* < >, 2MbF < € 
k=K+1 k=K+1 k=K+1 
Les écarts |2*—2£|, pour k& = 0,1,...,K, peuvent être rendus aussi petits qu’on veut 


en prenant z assez proche de 25, car une fonction puissance est continue. La somme 
SE olaxl|z"-z$| est donc aussi petite qu'on veut pourvu que |[2—20| soit assez petit 


et d’après (1) et (2), il en va de même de l'écart |f(z )—f (20). 
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Intégration et dérivation d'une série entière 


Proposition. Soit > azz"* une série entière de rayon R>0. Pour tout xe]-R,R|, on a 


La +00 +00 
agt® | dt = jh @ à ax" | = kagx" | 
À > à > k+1 dx D ï 2 : 


0 \r0 


Pour intégrer ou dériver la somme d’une série entière sur l'intervalle de convergence, 
on dérive ou on intègre terme à terme, comme pour une somme ne comportant qu’un 
nombre fini de termes. 


Démonstration. Montrons d’abord la formule d'intégration. Pour tout t€]-R,R|, appelons 
Sn(t)=ao+ait+.--+ant" les sommes partielles de la série et f(t)=lims, (t) la somme. Puisque 


la fonction f est continue, elle est intégrable entre 0 et x E]-R,R|[. Posons F(x >= f() dt 

et S,(x) =) sn(t) dt = Yo M On sait qu'il existe une série géométrique Mb" 
à = 

convergente, avec 0 < b < 1, telle que [axt*| < Mb pour tout k et Re tout { entre 0 et x. 


Il vient alors 


ak +e+1 
1 


<[t|laxtF| < RMbF donc la série entière _— ei E_4k+1 est absolument 


convergente pour { entre 0 et x. On en déduit 
+oo 


FG)- 5 (0) = [| [f(E)—s, (t)] a- [| >» ame) dt 
k=n+1 


Utilisons l'inégalité | | à p(t) dt} < | | h lt) dt} et que pour une série ÿux absolument 
0 0 


convergente, on a EX ur] < SX l'url (page 531). Il vient 


z +0 x +00 
[F(x) — S(x)| < | | 5 = LÉ ) dt < L | JS mn) dt 
0 k=n+1 0 k=n+1 


1—b 
Quand n tend vers l'infini, b"*! tend vers 0 et donc S,(xr) tend vers F(x), ce qu'il fallait 
démontrer. 

Pour montrer la formule de dérivation, il suffit de pouvoir appliquer la formule d'intégra- 


Ê n+ RM 
En sommant la série géométrique, on obtient |F(x) — Sale) < LL RM dt = Ed pr+1. 
0 


tion à la série dérivée 32 kaxz"-1. Nous devons donc seulement montrer que son rayon de 
convergence est au moins À. Soit z un nombre complexe tel que 0 < |z| < R et r tel que 
0 <}2| <r < R. Il y a une série géométrique convergente Mb*, avec 0 < b < 1, telle que 
| < Mkb*. Pour la série de terme général ux = Mkb*, 


laxz*| < MbF pour tout k, donc 
Uk+1 _ k+1 

que la série D kayz* est absolument convergente, et en la multipliant par 1/z, que la série 

SD kaxz*- 1 est convergente, d’où le résultat. 

Si l’on note À; le rayon de convergence de la série dérivée, cette démonstration prouve que 


on a ———b, expression qui tend vers b< 1, donc ÿ'ux est convergente. On en déduit 


l’on a Ra > R. Appliquons cela à la série intégrée, en notant R; son rayon de convergence : 
en la dérivant, on obtient la série de départ, donc R > R;. Mais comme la série intégrée 
converge pour |z| < À, on a aussi R; > R, donc finalement PR; = R : en intégrant une série 
entière, on ne change pas son rayon de convergence ; donc en dérivant, non plus. î 
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En dérivant ou en intégrant une série entière, on ne change pas son rayon de convergence. 


Pour visualiser plus facilement la somme d’une série entière, notons-la sous la forme 
+00 
Y. Get = apart tar de se dns 
k=0 

les trois points terminaux signifiant qu'on passe à la limite quand n tend vers +00. 


Série entière et développement limité. Puisque la dérivée d’une série entière 
de rayon de convergence R > 0 est une série entière de même rayon, on peut dériver 
sa somme autant de fois qu’on veut sur l'intervalle |-R, R|. 
Si f(x) = ao +at+ar?+asx + +a,r"+..., alors 

FE) = ai +2a524+3a327 +: tnasrt its 

f(x) = 2a2+3 -2%+4 3274... +... En(n—1)a 24... 
d’où f(0) = &, f'(0) = &, f”(0) = 2a> et fP)(0) = play, pour tout entier p > 0. 
D'après la formule de Taylor-Young (page 301), on en déduit les résultats suivants. 
— Si une fonction f est la somme d'une série entière, cette série est unique. 
— Si f(x) = 53% axx, le développement limité de f à l’ordre n au point O est 

do+ax+ax?+ -:+a,r"+o(x"). 


2.2 Développement en série entière 


Nous allons voir que les fonctions usuelles s'expriment généralement comme la 
somme d’une série entière, du moins au voisinage d’un point. 


Principaux développements en série entière 
Fonction Développement R 
nie as + = al 
ERA 1 
DFE i+r+l RE LRRS +2 ne ce 
sinz= .  e Ta l, +22 +. a 00 
COST = v ee : tie Are 00 
Arctant— Dan mir “is a+. 4 om. 1 
Cr un pue Co PEER CE EECRLE PSS 1 
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Pour démontrer ces formules, on pratique la dérivation et l'intégration, comme on 


l'a fait au chapitre 10 pour calculer les développements limités usuels. 


1)Le développement de 1-1 : est simplement le produit par È de la 


a-7 41/0) 


somme d’une série géométrique dont la raison z/a est de module |2/a| < 1. En intégrant 


pour x réel le développement 


de — _ 231... _J}rpn D... 
— 1—c+r-2$+... +(—1)taet+ de rayon 1, 
on trouve celui de In(1+x) qui a donc même rayon de convergence R = 1. 
| 52 5 a & (ax)* 
2) Soit a un nombre complexe. La série entière Ÿ° He ÿÙ Li est convergente 


pour tout réel x (exemple page 532), donc son rayon de convergence est 00. Posons 


2 n 
Fees 2 a af = 1+art La2+... + gt... En dérivant, il vient 
n! 


k=0 HI 2 
3 n 
/ 2 a 2 a n—1 
F'(x) = a+ st z +... nt + 
era a” ape E af(x) 
2 (n—1)! | 


donc f est solution de l'équation différentielle y’ = ay. Or les solutions de cette équation 


sont les fonctions Àe** (remarque page 444). Puisqu’on a f(0) = 1, il vient f(x) = e%* 


k 
En particulier, on a = f(1)=e", et cela quel que soit a complexe. Il suffit de 


substituer z à a pour avoir le développement en série entière de la fonction e* formulé 


dans le tableau. 


3) En prenant a = à puis a = — à, on obtient pour tout x réel 
CRE rs 1l. CE TR FT Re 
…— k! _ 2 3! 4! n! 
— à <= (—1)* if k : 1 > Li 4 (—-1)"i" 
AS à —. n 
e LE A œ l—ix pa +h a + Re +. 
k=0 


: | —1)" 
paires sont les mêmes, donc il reste e**+e **=21|1 1,24 L 34. s.+ Fo x 


2 4! 
et l’on trouve ainsi le développement en série entière de cos x. 


Pour avoir celui de sin x, il suffit de soustraire les deux séries entières. 


4) La dérivée de Arctanx est 7 Let pour |x| < 1, on a le développement en série 
+ 


x? 


entière 


De 1-2?+2t+...+(-1)"22%+... en remplaçant x par x? dans le déve- 
z 


loppement de ee Intégrons terme à terme et tenons compte de Arctan(0) = 0 : on 


trouve le développement de Arctanx et le rayon de convergence est encore 1. 


5) Nous calculerons le développement de (1+x)* dans l'exemple page 541. 
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+00 x? 
K=0 2k+1 
La série est absolument convergente si [x] < 1, car on a alors E 


Exemple 1. Calculons la somme f(x) = 5 


| < 


2k+ 
série géométrique 3 {x?[* a pour raison |x|? < 1. Si x > 1, le terme général 


T 
Ni Le 2k+1 
tend vers l'infini, donc la série ne converge pas. 

Le rayon de convergence est donc 1 et la fonction f est définie sur |—1,1{. 


Posons g(x) = xf(x), ou encore 


FR 2k+1 3 5 2n+1 
. x - æ z or 
9(a) 249 3 5 Tan 
En dérivant, il vient 
he) 2 NE 2n 1... dd 1 1 1 
g'(x) +R Ha + +aTt + er ol + 1 


donc g(x) — ; [In(1+x) — In(1-x)] et f(x) — _ mn ne . Cette expression est bien 


définie en x = 0 : en effet, (in TE) 2x, donc lim . in te) = 1 = f(0). 


=T æ—0 \2%  I1—x 
Exemple 2. Développons en série entière la fonction g(x >= [°° . sin(at?) dt. 
Quand + tend vers 0, = + sin(at?) N a — at, donc la fonction sous le signe intégrale 


est continue en 0. Son pen est 


213 2\2n+1 
L 2 1/2 (at) n (at°) 
a 1?) = t DS ds, 
ae, E 3! one 
345 2n+1/,4n+1 
ET MT NUE R ES, eu dir 
RE D 7 TEL 
et le rayon de convergence est co. D'où en intégrant de 0 à x : 
2 3 ,.6 2n+1 An+2 
z a” æ n_@ z 
= gd pe, 1 
ag ge ON Dapni anse 
2 2 ,.4 2n an 
__ aT 1 da ZT His ( 1)* a T 


+ 
(2n+1)! 2n+1 
avec un rayon de convergence O0. 


Comme la série est alternée, on sait que si l’on remplace sa somme par une somme 
partielle, on fait une erreur moindre que le premier terme négligé. 


2 6 
Ainsi dans le cas a — 1, si l’on pose o(x) — 2 6 alors 0,4 
0 < gta) — fe) < EL 
S LT) — LS 
++ 0 60) . 
Entre —1 et 1, l'erreur commise en remplaçant g(x) par le polynôme Saphs 
o(x) est moindre que 10 *. de o(x) 
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2.3 Calculs de solutions d'équations différentielles 


De nombreuses solutions d'équations différentielles peuvent s'exprimer sous la forme 
d’une série entière. Si la fonction inconnue s'appelle y, on fait la substitution y=) ax" 
dans l'équation différentielle et l’on identifie les coefficients de chaque puissance de x. 


Exemple. Posons f(x)=(1+x)*. Puisque f(x) =a(1+x) 1= ft) la fonction 
f est solution de l'équation différentielle 

(+) (+x)y = ay 

C’est la seule solution telle que f(0) =1. Posons y= Yayx" et remplaçons dans (+) : 
- dans ay, le coefficient de x est aa, 

- dans y/, le coefficient de x* est (k+1)ay:1, 


dans xy/, le coefficient de x est ka, 


donc il vient (k+1)ax+1 + kax = aax pour tout k. Pour k& = 0,1,...,n, on obtient 
4j — A 
2a> = (a—-l)a 
Nan = (a-n+l)an 1, d’où en multipliant membre à membre 
1: lonEl 
(nljas = afa-1}(a-2}-(o-nHia et a, = D nn, 
n! 


Puisque ao = f(0) = 1, on en déduit le développement 


a(a—1) : a(a—1)-.:(a—-n+1 
ee nr. 


(+) = 1 + ax + 


Si « est un entier p > 0, le coefficient &,.1 est nul, donc ax — 0 quel que soit k > p: 
dans ce cas, selon la formule du binôme, la série est simplement le polynôme 


care (De 


. a—n+1l 

Dans le cas général, aucun coefficient ax n’est nul et - _ | | tend vers 
An—1 nm 

1 quand n tend vers +co, donc le rayon de convergence est 1. 

Voici les cas particuliers de cette formule pour & = —1/2 et pour a = 1/2. 


1 1 IS T3 à 1-3-(2n—1) 
—{ D ir ns | Re] 
= FORT ao. ar Fo.age À + D din x + 
1 1. 2 1:3 3 1:3:::(2n—3) n 
A1 | +. | — = | 
“ D O4 dit sd Ce 
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Les fonctions de Bessel 

L'équation différentielle de Bessel est 

(ba) ay" + ay + (x? — à°)y = 0 

où «a est un nombre réel (exercice 6 page 474). 

Cherchons une solution (non nulle) sous la forme y(r)=2° 5 Vagat = ara "tt, 
Dérivons pour x > 0 : 


+00 +00 +00 
y = ax* 1 art + 2% ÿ kayæ*-! = >». (a+k)agr+# 1 
k=0 k=0 k=0 
+00 
y! = (a+k)(a+k—1)agr tk 2 
k=0 


a+ 


Dans r?y, le coefficient de x°%** est ag_ pour k > 2 et 0 sinon, 


dans œy, le coefficient de x°** est aa, 

- dans xy/, le coefficient de x°%T* est (a+k)ax, 

- et dans x?y”, le coefficient de x**® est (a+k)(a+k—1)ay. 

En écrivant que dans le premier membre de l'équation, le coefficient de x**®* doit 
être nul, on obtient (a+k)(a+k—1)az + (a+k)ar + ag-2 — ax =0 si & > 2. Il vient 


(2a+l)ai =0 et ax 2 + k(2a+k)ax —0 pour tout k > 2. 


Cas où 2a n'est pas entier. On a alors 2a+k 0 pour tout k, donc aussi 
ai = 0 d’après la première relation. Pour k —3,5,..., la seconde relation donne alors 
az = a5 =:::—0 : les coefficients d'indices impairs sont tous nuls. Pour les coefficients 
Se ; JE Le —1 
d'indices pairs, il vient er. , donc 
le @2k-2 2k(2a+2k) 


_ (—1)* ao 
A2k DE , pour tout k > 1. 
2° kl(a+1)(a+2) --:(a+k) 


tend vers 0 quand k tend vers +co, le rayon de convergence de la 


42k 


Puisque 
a 


série axx* est co. Finalement, en choisissant ao = 1, la fonction 


Ja(x) = x 


à (n" (£ ÿ” 
= kl(a+1)(a+2)-..(a+k) \2 

est solution de l'équation de Bessel (b,) sur l'intervalle ]0, +ocof. 

Supposons par exemple a >0. Comme les équations (b,) et (b_,) sont les mêmes, on 

trouve que si 2a n’est pas un entier, les fonctions J,, et J_, sont solutions. Mais J, 

est définie en 0, alors que J_, ne l’est pas. Ces fonctions ne sont donc pas proportion- 

nelles : par conséquent, elles forment une base de solutions de (b,), autrement dit : 


si 2a n'est pas entier, les solutions de l'équation de Bessel (b,) sur ]0, + 
sont les combinaisons AJ, +uJ_,, où À et ui sont des constantes quelconques. 
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Cas où « est un entier p. Si p > 0, on obtient de même la solution 


600 2 Pr 
Ja) 2 k!(p+1) +: (p+k) o) 


qui est cette fois la somme d’une série entière de rayon de convergence co. 


Pour chercher une autre solution, reprenons les calculs précédents avec a=—p et p>1 : les 
relations s’écrivent (—2p+1)a1 =0 et ax-2+k(—2p+k)ax =0 pour tout &>2. On en tire 
a1 =0 et comme —-2p+k20 pour k impair, il vient encore successivement 41 = a3=:::= 
a2i+1 = 0 pour tout à > 0. En prenant k = 2p, la seconde relation donne a2,_2 =0, et par 
En et er 120 les co- 
efficients d'indice 2p+2i sont déterminés par a2, : On à G2p+25 = En) 


suite G2p—2 =@2p-4a =" :—=@0=0. Pour 2k>2p, on a a2x = 


n a 
2(p+1)...(ptiil 


pour tout à > 0. Puisqu’on a pris & — —p, la solution obtenue est 
+00 i +00 i . 
= (—1)° 2p+2i (—-1) FATAL 
G2pT P _ — PTT =2P as — ( ) = 2 aopJp(t) 
: LL Fr)  (p+i)il r) (p+1)---(p#iil V2 D 


Ainsi, on trouve une solution proportionnelle à J, : la méthode ne donne pas toutes 
les solutions de l'équation différentielle. 


La fonction Jo. Rappelons que la fonction x ++ j : cos(zx sin 0) dô est une solu- 
T 


tion de l'équation de Bessel (b,) qui prend la valeur 1 en x =0 (exercice 8 page 394) 
et que les seules solutions définies en x — 0 sont proportionnelles à cette fonction 
(exercice 4 page 473). La série entière J prend la valeur 1 en x = 0 : c’est donc que 


l'on a pour tout nombre réel x l'égalité 
T +00 k : : : 
1 : (—1) 2 
= cos(x sin 0) dû = Ji(x) = =] a es 
7, costesine)d8 = (= TE ne aus 


Remarquons que la série est alternée. En dérivant terme à terme, on vérifie que 


Hat) =-H(s). 


2.4 Polynômes de Legendre 


Étant donné un entier n > 1, considérons l'équation différentielle de Legendre 
(Lun) (1—x°?)y" — 2xy + nn + 1)y = 0 
Cherchons des solutions sous forme d’une série entière y = D ayr*. 

Dans 2xy7/, le coefficient de x est 2kay, 

- dans x°y", le coefficient de x* est k(k—1)ay, 

- et dans y”, le coefficient de x” est (k+2)(k+1)ag», 

donc on a pour tout k la relation (k+2)(k+1)ag49— k(k—1)ax —2kax +n(n+1)ax=0, 
ou encore 


(+) (k+2)(k+l)agi2 = —(n-k)(n+k+l)ar 
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Puisque n est entier, le terme de droite est nul pour k — n, donc tous les coefficients 
&n+2i Sont nuls pour à > 1. 
Supposons n pair, n — 2m 

a) Supposons ap — 0. Alors d’après la relation (+), tous les coefficients d’in- 
—(n—1)(n+2) — 


dices pairs sont nuls. Le coefficient a; détermine a3 — 2 di, @5 


(n—3)(n—-1)(n+2)(n+4) 
2-3-4.:5 


a et plus généralement, on a 


(n—2k+1)(n—2k-—1)...(n—-1)(n4+2)(n+4) :.:(n+2k) 
(2k+1)! 


a = (—1)* ‘4 


On obtient ainsi une série entière y = LE ax+12 "+1 solution de l'équation 
: « ak+2 

(Ln). Si «1 0, le rayon de convergence est 1, car d’après (x), | | à | tend vers 
dk 


1 quand À tend vers +00. 

b) Supposons a — 0. Cette fois, tous les coefficients d'indices impairs sont nuls, 
de même que tous les coefficients d'indices pairs supérieurs à n — 2m : on va 
donc trouver un polynôme pair. La relation (x) donne (n—k+2)(n+k-—1)ag-_2 = 


—k(k—1)ax et le coefficient an — a2m détermine G2m-2, G2m-4, --,@o, Selon la 
formule 
. nl(n—1)! (2n—2k)! 
m—2k — I F my 0O<k< m. 
Com = O3 on D HG Hi(n 26) 2% POUr "0 
2n)! 
En choisissant Go» = An = _. on obtient comme solution de l'équation 
n: 
différentielle (L,) le polynôme 
7 2n—2k)! : 
P, _ 1 k ( n—2k 
(a) 2 pin R Un 201 


Cas où n est impair. En posant n = 2m+1, la même formule que ci-dessus définit 
un polynôme P, solution de l'équation différentielle (L,,). 
Quel que soit n, le polynôme P, est de degré n et a la parité de n. Les polynômes 


F, s'appellent les polynômes de Legendre. Ainsi 


A 7 (821) = 3 (GrŸ-32) — 2 (852! -3077+3) 
On peut calculer de proche en proche les polynômes de Legendre au moyen de la 
relation suivante : 

(n+2) Paso = (2n+3)x Pi — (n+1)P, , pour tout entier n > 0. 
Ces polynômes interviennent souvent en Analyse. En voici quelques propriétés. 


Formule de Rodrigues : P,(x) = —1— 4 [(&?—1)}?] 


27m! dx” 
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n : ! _9k 
D'après la formule du binôme, (x?—1)" = _,(—1)* HI M __;2n—2k, Pour tout g>n, 


(n—k)! 
! 
la dérivée n-ième de x est g(qg—1)---(q—-n+1)r17" = À 21". I vient donc 
qg—n)! 
n 2n—2k)! 
Le gi? =. x"—2# pour 2k < n, c'est-à-dire pour k < m puisque m vaut 
: ou M selon la parité de n. Finalement, on obtient 
d” 2 n | k__n! (2n—2k)! 08 n 
1)41= 1 = 2" .nl Pa(z). 
ae [°°] 2 Past Got RE FRE) 
. | . 1 0 sin £q 
Relations d'orthogonalité : M P:(DP.() dt = À ing 
2n+1 
Si r <q, la dérivée d” [(x2—1)2] est divisible par (x?—1)1-", donc s’annule en = +1. 


dx” 
Supposons q > n. En intégrant successivement par parties, il vient 


Je lte?-27] [Cet] de 


| LE CRUE ICS v] Le LE le) à 


La dat dr+i 


1 in 
= (ax | (x?—1)9 d° [(x?—1)"] dx , car les crochets sont nuls. 


2 


Si q>n, alors on a g+n > 2n et comme le polynôme (x*—1)" est de degré 2n, sa 


dérivée (q+n)-ième est nulle : on donc la formule annoncée pour q > n. 


Supposons q = n. D'après le calcul ci-dessus, il vient 
1 


[ d [(e2—1)"] d [(a2—1)"] de = ( w" | (21) 7 [(x2—1)"] de 


nm 12 
1 dx dx Fr dx?" 


= (2n)! [. (1-x?)" dx, car _. [(x2-1)7] = (2n)! 


1 
= 2: ent f (1-x?)" dx , car la fonction à intégrer est paire 
0 


r/2 
= 2" ent f (sin0)?"*1 40 , en posant x = cos 
0 


GE CP). Gerice ji page #4) 
=92.(2n)— 7" (exercice age : 
3.5... (2n+1) pes 
1 2, 2:(2n)! 2-4...(2n) _ 2 US 
On a donc 1 Pat) dx On) 3-5. Qnt) Hit’ ar 2 -n!=2.4...(2n). 


CHAPITRE 17 - SÉRIES, SÉRIES ENTIÈRES, SÉRIES DE FOURIER - 545 


Un espace euclidien de fonctions. Pour toutes fonctions f et g continues sur 


[-1,1], posons 1 
fa [| rate dr 


On a f-g=g-f et puisque intégrer est une opération linéaire, on a (f1+f2)-9=f1-9+f2-9 
et (Af)-g= . . 9) : : le nombre f-g dépend donc linéairement de chaque terme. De plus, 


f-f= PU ? dx est strictement positif si f n’est pas identiquement nulle sur [—1,1]. 


On a donc ainsi défini un produit scalaire sur l’espace vectoriel V des fonctions 
continues sur [—-1,1] (chapitre 7). 

D'après les relations précédentes, les polynômes de Legendre F5, P1,...,P4... sont 
deux à deux orthogonaux pour ce produit scalaire. Puisque P, est de degré k, les 
(n+1) polynômes Ps, P,,...,P, forment une base du sous-espace P, des polynômes 
de degré inférieur ou égal à n. En divisant chacun par sa norme, on obtient une 


base orthonormée de P,. 


Les polynômes 1/1/2 Po, 3/2 P1,...,/(2n+1)/2 P, forment une base or- 
1 


thonormée de l’espace P,, muni du produit scalaire P - Q = | P(x)Q(x) dx. 
1 


Soit f une fonction appartenant à V. Parmi les polynômes P de degré au plus n, 
celui qui rend minimum la distance ||f — P| est, d’après le théorème de la projec- 
tion page 209, le ee orthogonal de f sur le sous-espace P, : son expression est 


LP: Po) Po + (fe Pate + PO (f Ps) Pa 


Des harmoniques sphériques 
Repérons les points 1 de R° par des coordonnées sphériques 
x —=rcosôsinmwY , y—rsinbsinY , z—rcosv 
où r est la distance OM, 0=Ox, Om (m est le projeté de M sur xOy) et D=Oz, OM 


(OLO<2r,, 0L<V<7T). 
Le laplacien d’une fonction ® = r"S(0,4%) est 


n2| 1 2 nos 1 _®S 
RTL evo PT 
Supposons que les valeurs de ® présentent une symétrie de révolution par rapport 
à l'axe Oz : cela veut dire que S ne dépend que de l'angle #. La condition A = 0 
pour que ® = r"S{4) soit harmonique est donc 


dS 

sin + n(n+1)(sin Ÿ 

a [in 8] + n(n+1)(sin 0)S 
. . … dS __ dS du __ dS : dS _,2 1 dS 

Posons y = cos. Il vient A di sinw, donc (sin) ZA (u—-1)— et 


d. dS d |,,2 ds | du 
He Le | D a 


(A) 
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La condition (A) s'écrit 7 jan | + n(n+1)S = 0, ou encore 
ui mn 


2 
(a) x) de 2p1 
Pour n entier positif, c’est l'équation différentielle de Legendre (L,). Si n est négatif, 
alors en posant k— —n—1 > 0, on a n(n+1) = k(k+1), donc S(u) doit être solution 
de Lx. On a ainsi le résultat suivant. 


Pour tout entier n positif, les fonctions r""P, (cost) et LP, (cos 4) sont harmoniques. 
r 


 Donnons-nous sur la sphère de rayon a, une fonction f(#) combinaison de poly- 
nômes de Legendre en cost : f(#d)=coPo(cosd)+c1 Pi(cosd)+-.:+c, PA (cost). Alors 
la fonction F(r,4#) = coPo(cost) +c1 TP (cosd)+...+ch Le Po (008 4) est harmonique 


dans la boule de rayon a et vaut f sur le bord de la boule : en effet, pour r = a, on a 
F(a,v) = f(#).Si l'on cherche dans la boule un potentiel harmonique qui satisfait à peu 
près une condition c(#) donnée sur le bord, on peut commencer par approcher c(4) 
par une combinaison f(1#) de polynômes de Legendre, comme en fin de paragraphe 


précédent, et utiliser F(r,4). 


Sur une sphère, chaque fonction ®,, =r"P,(cos4#) ou P,(cos#) s’annule le long 


_12 
rt 
des parallèles =constante telle que cost est une racine du polynôme P, ; cela découpe la 
sphère en bandes horizontales appelées zones : les D, s'appellent des harmoniques zonales. 


2.5 Un exemple de fonction génératrice 


Considérons les arbres ayant un seul (ab) (cd) (a(bc))d 

sommet initial et exactement deux  ,, “di ab d 
arêtes issues de chaque sommet non 

terminal : ce sont les arbres binaires. a b ce  d 
On les utilise en algorithmique pour décrire les 

différentes façons de parcourir un processus où il 
y a deux possibilités à chaque étape. Ils décrivent 
aussi les différentes manières de parenthéser un mot 
MM Mn : pour le mot abcd, on ainsi les cinq 
possibilités ((ab)c)d, (a(bc))d, a((bc)d) a(b(cd)) u 
et (ab)(cd). Nous allons compter le nombre a, d'arbres binaires ayant n sommets 
terminaux. 


a 


a 


Soient À et B des arbres binaires à p et q sommets terminaux. Appelons a le sommet 
initial de A et b le sommet initial de B. Formons un nouvel arbre AxB en nous donnant 
son sommet initial $ et en accrochant À et B par leur sommet a et b à deux arcs S,a et 
S,b issus de S : l'arbre binaire A*xB possède p+q sommets terminaux. Tout arbre binaire 
est formé de cette manière, à condition d'introduire parmi les arbres binaires l’arbre-point 
qui n’a qu'un seul sommet et pas d’arête. On en déduit que le nombre a, est la somme 
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des produits a,a,;, où p et q sont quelconques tels que p+q = n. Il y a un seul un arbre 
binaire n'ayant que deux sommets terminaux, donc a2 = 1. Puisque a; = 1, on obtient 


An = Uän-1 + 424n-2 + °°: + An-141 , pour tout entier n > 3. 


Considérons la série entière Sa,x", où l’on a posé ao — 0. Dans la série produit 
(anx")", le coefficient b, de x” est précisément la somme ci-dessus, d’après la 
définition page 535. On a donc 


bb=b =0=a&, === et b, — a, pour n 23. 


Si l’on admet pour le moment que la série définit bien une fonction S(x) =, Ant”, 


alors il vient JS 
2 10 
S(x) — [S(x)] = + (an —bn)r" = (a1—-b1)x = x. 
n=0 
Ainsi S(x) est solution de l'équation Z?—Z-—x et S(0)—0, d'où S(x)— ; — ; 1—4x. 
1-3... (2n— 
Dans le développement en série de /1—4x, le coefficient de x" est — LOTS y 


1:3:::(2n-8) on _ 113: (20-38) 


(page 541), donc a» = 2-1, En multipliant haut 


2.4...2n Le daem 
et bas par 2-4-::(2n—2) = 2" l(n—1)!, il vient la formule simple 
(2n—2)! 1 f2n-1 a 
n = = , pour tout n > 1. 
L nl(n—1)!  2n-1\ n Po 


On dit que S(x) est la fonction génératrice de la suite (a), car le développement en 
série de S(x) a pour coefficients les a». 


Décomposition de Fourier 


Nous allons considérer des fonctions f d’une variable réelle, continues, périodiques 
de période T et à valeurs éventuellement complexes : on a donc f(x+T) = f(x) 
pour tout x € R. Soit V l’espace vectoriel constitué par ces fonctions. 

Si f et g sont des fonctions appartenant à V, on définit leur produit hermitien 
comme page 207, en posant 


T 
fa À f ro 


ii 
La norme associée est || f|| — 1 FOIE dt] 


Si par exemple f est un signal temporel, || f||? s’interprète comme la puissance dissipée 
pendant une période. 


Posons w — Pour tout entier n € Z, définissons la fonction e, en posant 


niwr 


En(x) = € , pour tout x ER. 
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Les fonctions e, ont pour période T': en effet, e, (T°) =eniwT _e27i 1] donc pour tout 
x, on à En(t+T) = en(r)en(T) = eh(x). De plus, nous avons montré (page 208) que 
En * Ep = : de WE , autrement dit : 

1 sin=p 


niwr 


les fonctions e,(x) = e , Où nEZ, forment une famille orthonormée dans V. 


Définition 
Soit f une fonction appartenant à V. Les coefficients de Fourier de f sont les 


14 
nombres complexes c,(f) = f : en — L } f{tje-rivtdt, où nez. 


T 
Rappel : Si u est une fonction périodique de période T, l'intégrale j u(t) dt est 


égale à l'intégrale de u sur n'importe quel intervalle de longueur 7. 


3.1 Approximation par des polynômes trigonométriques 


Pour tout entier N > 0, notons Vy l’espace vectoriel ayant pour base les e, avec 


—N £n< N. Les éléments de Vn sont les combinaisons linéaires à coefficients 
complexes des fonctions e, pour |n| < N. Ils s’écrivent de manière unique 


P(x)= >" nAnen(x), où les À, sont des nombres complexes. 


= 

De telles fonctions P(x) s'appellent des polynômes trigonométriques, car pour tout 
. . ji Lo nm 

entier relatif n, on a en(x) = (e*“*)" = (e1(x)) 


Pour un polynôme trigonométrique P = DN__ y Anen, on a [PP = SN Al. 


En effet, les \, sont les coordonnées de P dans la base orthonormée des e,, (proposition 
page 206). 


Soit f € V. D'après le théorème de la projection page 209, le projeté orthogonal de 
f sur le sous-espace Vy est le polynôme trigonométrique 


Sn(x) = Zn-n En(FJen(e) 
On a donc : | f — Sx|| <||f — PI, pour tout P € Vw. 


Le polynôme trigonométrique SN est la meilleure approximation de f, au sens 
de la norme de V, par un polynôme trigonomérique ne faisant intervenir que les 
avec In] < N. 


niwT 


fonctions e 
Au moyen de polynômes trigonométriques, on peut approcher les valeurs de f sur tout 
l'intervalle [0,7], car on a la propriété suivante. 

Etant donné un nombre € > 0, il existe un polynôme trigonométrique P tel que 
|f(x)-P(x)| < € quel que soit x € [0,T]. 
Nous verrons que ce qui compte vraiment, c'est l'existence de polynômes trigonomé- 
triques qui rendent ||f—P|| aussi petit qu’on veut. 
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Propriétés des coefficients de Fourier 

Puisque Sy est le projeté de f sur Vw, f—SNn est orthogonal à Vy, donc à 

Sn. On a f—(f-Sx) + Sn, où f et f—Sn sont orthogonaux, donc par le théo- 

rème de Pythagore (page 203), il vient ||f|P = ||f — Sw|?+||Sx|? > |[Sw|?. Comme 
2 

IS? = nn len(N) 


2 
En len(P)|" < [FI , pour tout N. 


Nous allons être amenés à sommer des nombres indexés par tous les entiers, positifs 
ou négatifs. Étant donnés des nombres complexes (a,)1-7, nous dirons que la série 


, on en déduit 


San est convergente si les sommes partielles ol 


n= 


_nûän Ont une limite quand N 


tend vers +oo. La somme se note alors 5%. an. De même, une série Ÿ1,,.7 an 
est dite absolument convergente si 5 |a,| est convergente. 


Théorème de Bessel. Pour toutes fonctions f et g continues et périodiques de période 
T,ona 


AJ N —= 
) im If — Eux En(PJenl = 0 


ii] 7 D FCO) É dt + pu le (Pl (égalité de Bessel) 


= 
sn dl fT Er + TAN 
in à O9 dt = DE x en (F)en(g). 

D'après (ï}, la série ÿ° let f )° est convergente, donc son terme général tend vers 0. 


Les coefficients de Fourier c,(f) tendent vers O quand n tend 
vers +00 Ou vers —00. 


2 & _ 
Cn(f )| est à termes positifs et ses sommes 


Démonstration du théorème. La série 5 


partielles HSE _. lat ff sont toutes majorées par ||f|?, donc la série converge. Pour 


tout N, posons Sx = DN__,,c,(f)en. Choisissons un polynôme trigonométrique P tel que 


|f(x)-P(x)| <e pour tout x € [0,7]. On a alors ||f—P||? = Lf" HO 401 dt £e?. Puisque 
P est combinaison linéaire d’un nombre fini de e;, il y a un indice q tel que P est com- 
binaison des ex pour |k] < q. Pour tout N > q, Sn —P est alors combinaison des ex pour 
k| £ N, autrement dit Sy—P € Vx. D'autre part, f—SNn est orthogonal à Vy et l’on a 
(f—-Sn) +(Sn—P)= f-—-P. D'après le théorème de Pythagore, on en déduit 

If-Snl? +11S8v-PI? = 1f-PIÀ 
Par suite, on a | f-Sx|| <[|f—P| <e pour tout N > q, ce qui montre (il. 


On a aussi f=(f-Sx)+$Sx et d’après le théorème de Pythagore, || f|?=||f-Sx|?+|Sx1?.0Or 


nous venons de voir que | f—-Sx| tend vers 0 quand N tend vers +co, donc lim I Sx 11? = 
—+00 


fl, ce qui est l'égalité (ii). 

Notons 5°, le projeté orthogonal de la fonction g sur Vy. On a (f—-Sx)-S% =0=Sx:(g-5%), 
car f—S\ et g—S', sont orthogonaux à Vy. Par suite (f—Sx)-(g—-S%)=(f:g)—(Sn-S%). 
Puisque le module du produit scalaire est inférieur ou égal au produit des normes (inégalité de 
Cauchy-Schwarz, page 204), on en déduit [CF -g)—(S\: Sn) £|f—-Swlllg-S|. Le membre 
de droite tend vers 0 quand N tend vers +00, donc aussi (f-g)—(Sx-S%). Puisque Sn et SY 
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sont des polynômes trigonométriques, leur produit scalaire est Sn + 5 = 5°, c(f)c(g), 
d'où l'égalité (ii). = 
Proposition. Soient f et g des fonctions continues et périodiques de période T. 


Pour tout n, on a Cn(f +g) = Cn(f) + Cnfg) et si À est un nombre complexe, 
Cn(AŸ) = Acn(f). 
ü] Si Cn(f) = Cn(g) pour tout n E Z, alors f(x) = g(x) quel que soit x. 


Démonstration. La première propriété vient de la linéarité de l'intégrale. Supposons c;(f)=— 
Cn(g) quel que soit n € Z, donc pour la fonction u = f—g, on a c,(u) = 0 quel que soit n. 


T 
D'après l'égalité de Bessel, ||u||? — : Î lu(t)[* dt = 0, donc u est identiquement nulle. 


Cas d'une fonction à valeurs réelles 


Supposons que f est continue, de période T' = 27 et à valeurs réelles. 
uw 


On a alors f(r)enivr = f(x)e-"i? et par définition des coefficients de Fourier, il 


vient cn(f) = c_n(f). On pose pour tout n > 0 : 


T T 
an(f) = _. f(é) cos nut dt et b,(f) = 2 f() sin nwt dt. 


Puisque eMivE — cos nur + isinnwz, on a alors (en omettant la référence à f) 
An = En + C-n b, = le, — Gen) , donc ap = 2cCo et bo = 0 
20, = @n — 10; 26 ; =, +20: = 20; 


d’où 2[|c,[? +|c_,[?] = a? +62. On en déduit les formulations suivantes. 
_ 2 

2 FOIE = . +IÉX (a? +02) (égalité de Bessel). 

 Su(x) = 7 + SN. (an cos nwz + b, sinnwr). 


T 

_ 2 3 | f(E) — Sn(t)f dt= ir, (a? +02) tend vers 0 quand N tend vers +0. 
+ T/2 

Parité. Onab,(f)= 4 _. f(t) sin nwt dt : si la fonction f est paire, alors f(t)sinnwt 


est impaire et l'intégrale précédente est nulle. De même, si f est impaire, f(t) cosnwt 
est impaire et an (f) = 0. 


Si la fonction f est paire, alors b,(f) = 0 pour tout n. 
Si la fonction f est impaire, alors a, (f) = 0 pour tout n. 


Exemple. Posons f(x) = |sinx|. La fonction f est 


continue et puisque sin(x+7) = —-sinx, f est pério- a 
dique de période Tr : on a ici T = 7, donc w — 2. La + 


æ 
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fonction f étant paire, ses coefficients b, sont tous nuls. On a 


An = 2] sin { cos 2nt dt = 1] [sin(2n+1)t+ sin(2n—1)t] dt = ms | 
0 0 


T T 
En particulier, ao — — et l'égalité de Bessel s'écrit 
T 


+00 T 
8 16 1 2 : 12 
+ > = sint)* dt 
F2 mn de (An2=1}? 2 | ( ) 


On a _ : 
| (sin t}? dt = 1 J (1— cos 2t) dt = ; = 2 [sin 24] — à 
LPS 8 16 +00 1 " +oo d T2 1 
LS der +  —>5—> = let finalement 2 = | 
T° L T° Den (4n?—1)? Zn (4n?—1)? 16 2 


Approximations en moyenne 
N . 
1} D'après le théorème de Bessel, les polynômes trigonométriques Sn(x)=3 c,(f)e"?#? 
n=-N 


T 
ont la propriété : ji HOMOIE tend vers 0 quand N tend vers +co. 


On dit que les fonctions SN tendent vers f en moyenne quadratique. 


T 
2) Montrons que Î [f (t)—S n(t)| dt tend aussi vers 0 quand N tend vers +co. 


On dit que les fonctions SN tendent en moyenne vers f. 


Pour toutes fonctions f et g continues sur [0,7], on a l'inégalité de Cauchy-Schwarz 


(page 207) 
Fe Fat at < Cf MOIÉ à) D CF lg()2 at) 


Appliquons cette inégalité à la fonction | f (x)| en prenant g constante de valeur 1 : 
il vient 


0< f” |Fbtar < (F'rora)” de a) _VT (f'uwra) 


T 
Remplaçons f par f—Sn : d’après le théorème de Bessel, Î LfC)-Sn(t)l dt tend 


1/2 


1/2 


T 
vers 0 quand N tend vers +00. L'intégrale | | fŒ)-S n(t)| dt est positive et majorée 


0 
par une quantité qui tend vers O0 quand N tend vers +, donc elle tend vers 0 


quand N tend vers +00. 
T 
Dans une approximation en moyenne du type Î [f(t)—g(t)| dt < , ce qui compte, 
c'est que l’aire comprise entre le graphe de f et celui de g soit petite en valeur 


absolue : les fonctions f et g peuvent prendre des valeurs très différentes, mais 
seulement sur des intervalles très petits. 


Une approximation en moyenne n'est pas nécessairement 
une approximation en valeurs. 
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Illustrons les deux types d’approximation pour la fonction f constante de valeur 1 sur 
[0, T7. 

La figure 1 montre une approximation en valeurs : le graphe de g est dans la bande 
1—(E/T) < g(x) < 14+(E/T), donc |f(æ)-g(x)| < e/T quel que soit x. Par suite, on a 
Î A | FC) g(t)| dt < Î L e/T dt = €. Sur un segment, une petite approximation en valeurs 
est aussi une petite approximation en moyenne. 

Sur la figure 2, on a pris h(x) = f(x) sauf sur un petit segment de longueur 2e/n 


et le maximum de h est choisi égal à n, un entier strictement positif quelconque : la 

fonction h peut prendre de grandes valeurs, mais l'intervalle où cela se produit a une 
T 

longueur petite. En moyenne, l’approximation F. | f (t)—h(+)| dt est l’aire d’un triangle 


de base 2£/n et de hauteur n—1, donc Î MOTO) dt = (1/2)(2e/n)(n — 1) <e. 


use |f(æ)—-g(x)| < max, [f(x)-h(x)| = n —1 


| [f(E)—-g(#)| dt < € Î [f(t)—R(4)] dt < € 


> figure 1 = figure 2 


3.2 La décomposition de Fourier 


élargissons le cadre précédent pour tenir compte de fonctions ayant des discontinui- 
tés ou qui ne sont pas définies en certains points. On doit se limiter à des fonctions 


T 
u telles que l'intégrale généralisée Î lu(t)? dt existe. 


Définition L 

2 
Si l'intégrale généralisée Î lue) | dt existe, on dit que la fonction u est de carré 
intégrable sur [0,T]. L'ensemble de ces fonctions forme un espace vectoriel noté 
L?([0, 71). 
1 


pour OÜ<x<2r. Ona lu(x)|? < —— et si 2a<1, 
DA 


COS T 
x* 


Exemple. Posons u(r) — 


2 
l'intégrale généralisée Î À 7 dt existe (page 327). On en déduit que si @ < 1/2, la 
fonction uw est de carré intégrable sur [0,27]. 


Si l’on part d’une fonction « continue sur [0,7] et qu’on la modifie en un nombre fini de 
points, on obtient une fonction v telle que |u—v| et [u—v|? ont une intégrale nulle. Pour 


Te 
des fonctions non continues, la propriété .. lu(t) (6) | dt = 0 n’assure donc pas que 
0 


les fonctions u et v sont égales, mais seulement que, sur [0,7], on a u(x) =v(x) sauf en 
des points formant un ensemble négligeable du point de vue de l'intégrale, comme par 
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exemple un ensemble fini ou l’ensemble des points d’une suite. Ainsi, dans un espace con- 


2 2 
tenant des fonctions discontinues, l'intégrale | [u(t)| dt ne constitue plus une norme. 
0 


Convention : Dans l’espace L?([0,71), convenons de considérer comme identiques 


M 
des fonctions w et v telles que { lu(t)—v(e) | dt = 0. 


Cette égalité dans L?([0,77) s'écrit simplement u=v, bien qu’on ait seulement u(x)=v(x) 
presque partout. Maïs si l’on veut exprimer que les fonctions w et v prennent les mêmes 
valeurs en tout point de [0,7], c’est-à-dire sont égales au sens habituel, on écrira : 
u(x) = v(x) quel que soit x € [0,7]. 


Notation : L'ensemble des fonctions périodiques de période T' et de carré intégrable 
sur [0,7] se note L?([0,7]). Pour f et g dans L?([0,7]), 


T …_ 
le produit scalaire f : g = 7 ‘. f(€)g(®) dt est bien défini 
et ||f| = (ff)? est une norme sur L?([0,T]). 


Exemple. Considérons la fonction u définie sur [0,1[ 


par D RE 
(3—-2x)/A si1/2<x<1 la fonction f 


Bien que u ne soit pas continue en 1/2, elle l’est sur chacun des intervalles ]0, 1/2] 
et ]1/2,1[, donc u € L?([0,1]). Étendons u par périodicité en une fonction f de 
période 1 : alors f appartient à l’espace L?([0,1]). 


Théorème. Les propriétés énoncées dans le théorème de Bessel sont encore vraies pour 
les fonctions f périodiques et de carré intégrable sur [0, T1]. 


Ce qui compte en effet dans la démonstration, c’est la possibilité pour tout £ > 0 donné, 
de trouver un polynôme trigonométrique P tel que | f—P| <Ee, c'est-à-dire d'approcher 
f en moyenne quadratique par des polynômes trigonométriques. 


Expliquons comment réaliser cette approximation lorsque f 
appartient à L?([0,1]). Prenons par exemple la fonction f 
dont le graphe a l’allure ci-contre (dessinée en trait plein), avec 
une discontinuité en a. Modifions f sur un petit intervalle 
de longueur r autour du point de discontinuité, en considé- a T x 
rant la fonction continue g qui emprunte le segment de droite en pointillés : comme f et 


F 
g ne diffèrent que sur un intervalle de longueur r, l'intégrale F Î | de (#)-g(#)| dt peut 


être rendue inférieure à £? à condition de prendre r assez petit : on a alors || f—g|| <e. 
Puisque g est continue, il y a un polynôme trigonométrique P tel que |g(æ)—P(x)| <E 
1/2 
1 


T 
pour tout x € [0,T], ce qui entraîne ||g-P| = 2 / (PO dt < €. Comme 
0 


f-P=(f-9)+(g-P), on a l'inégalité triangulaire ||f—P| </||f—-gl| +11g-P], d'où 
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If—-P]| < 2€. Pour des valeurs € petites, les polynômes P ainsi construits approchent 
f en moyenne quadratique. 


Proposition. Si f et g appartiennent à L?([0, T]) et si ca(f) = ch(g) quel que soit 
n, alors f = g dans L?([0,T}). 


En effet, si ch(f) = cn(g) quel que soit n, alors c,(f—g) = c(f)—-cn(g) = 0, donc 
If — gll = 0 d’après l'égalité de Bessel. Par suite f = g dans L?([0, T)). 


Exemple. Soit 4 la fonction périodique de période 
27 définie en posant g(x)=x pour -r<x<r.Onaici 
w = 2r/T = 1 et comme g est impaire, ses coefficients 


T 
an Sont tous nuls. On a b, = 2 | tsinntdt et 
TT AT 


| sin nt dt = 1 {{cos nt]" +1/ cos nt dt 
= n FR jf 


T T 


” (ee 
= —[2(—-1)"7] = -——— 27 car la dernière intégrale est nulle, 
n 
oil 2 a be : LL 24 Ste p2 
donc b,, = 2-—. Explicitons l'égalité de Bessel 10] der: %-Ona 
nm 
1 pou 127 _ 27? 2 _ À P LR ar a FOI 
ft dt _—. - et b} 4, d'où légalité po: A p. 


La décomposition de Fourier 
Définition 
Une famille (Qn)nez de nombre complexes est dite de carré sommable si la série 
S_la,l? est convergente. Ces suites constituent un espace vectoriel noté £?. 


Sife L?([0,71), la série ÿ° Cf ) k est convergente, donc (c;(f)) est un élément 


de 22, 


nez 


Définition 
La décomposition de Fourier est l'application  : L?([0,T]) — ? qui à f associe 


(cn(?)) nez: 


Dans ce cadre plus général, on a le résultat suivant. 


Théorème. La décomposition de Fourier F : L?([0,T]) — €? est une bijection linéaire. 


Justification. Puisque chaque coefficient de Fourier c\ dépend linéairement de la fonction, 
l'application Z est linéaire. Si F(f) = F(g), alors c(f) = c(g) que que soit n et d’après 
la proposition précédente, on a f = g dans L?[0,T] : par la décomposition de Fourier, tout 
élément de {? a donc au plus un antécédent. 


Admettons que si (a,),ez est un élément donné de {?, il y a une fonction f € L?([0,71) telle 
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que ||f — Px|| tend vers 0, où les Py sont les polynômes trigonométriques r ARTE, 
Soit n un entier tel que [n| £N.On a Pv-e, = a, car les ex sont deux à deux orthogonaux et 
de norme 1. Par suite len(f) an | : [fé Py'en | = [Cf Py)'en| £||f-Pxlllel=1f-Pvi. 
Quand N tend vers +00, le membre de droite tend vers 0, donc let) — an | =0 et c,(f)=an. 
On a ainsi F(f) = (ar)nez : tout élément de {? est donc la décomposition de Fourier d’une 
fonction de L?(10,T]). ü 


Par décomposition de Fourier, un signal périodique f de carré intégrable se code 
en une suite CA) de carré sommable. 

Le code caractérise parfaitement le signal et de plus, toute suite (an)nez de carré 
sommable est le code d'un unique signal périodique. 


3.3 Propriétés de la décomposition de Fourier 


+00 
n—-00 An£n la 


Notation : Pour toute suite (an)nez de carré sommable, on note ÿ 
fonction de L?([0, T1) ayant pour coefficients de Fourier les @,, c'est-à-dire la fonc- 
tion f telle que Z(f) = (an)nez. 

D'après le théorème précédent, on a donc 


+00 


f = ÿ Cn(f)en, pour tout f € L? (10, T1). 


n——00 


Cette notation fait apparaître f comme la somme, dans l’espace L?([0,T]), de la 


série D Cn(f)en- 
Définitions 
La série D c;(f)e, s'appelle la série de Fourier de f. 
2 


Les fonctions c,(f)en(x) = Cn(f}e"* T°, qu'on appelle les harmoniques de f, cons- 
tituent la décomposition spectrale de f. 


F 
Le coefficient co = (1/T) ; f(€) dt est la moyenne de f sur une période. 


— L'harmonique c,e?7"?/T est de période T/n, donc de fréquence n fois la fréquence 


1/T de f. Son amplitude est |c,|. 

— Dans L?([0,7]), l'égalité f=D* , cnen signifie qu’en tenant compte d’un 
nombre suffisant d’harmoniques, on peut approcher le signal f par une somme 
finie Sn =  . n Cnên de manière que sur chaque période, f—Sn soit d'énergie 
aussi petite qu’on veut. 


Si la fonction f est à valeurs réelles, elle est égale dans L? ([0, T\) à 


+00 

(0 : 

+ ) (an cos nwx + b, sin nwzx). 
n=1 


La fonction a; coswx + b\ sinwx, de période 7, est l’harmonique principal de f. 
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Exemple 1 RPC d'un courant redressé. La fonction f(x)=—|sinx| 
a pour série de Fourier + | CE _ (exemple page 551). Sur les figures 
An 
ci-dessous, on a représenté LE sedhe de f et celui des deux premières approximations 


2 _Acos2r se) = 2 4 [es2e + cost |. 
T TT à TT 3 15 

Remarquons que ces approximations sont très bonnes, bien que, en valeurs, elles 
le soient un peu moins au voisinage des points kT où le graphe présente deux 
demi-tangentes de pentes différentes. 


Quand on redresse un courant alternatif de fréquence v, on obtient pour la tension une 


81(x) — 


fonction du temps de la forme V{({t) = Vinax[sin(2rvt+0)|. Les premiers termes de la 
série de Fourier permettent ainsi d'approcher V par des polynômes trigonométriques 
de fréquences 1,21, 31, ... 


Représentation spectrale. Commençons par centrer le signal f(x)—|sinx| précé- 
dent autour de sa moyenne en considérant f(x) = f(x) — : qui est de nulle. 
Puisque f. est de période +, sa fréquence est 29 = 1/7. 

Considérons un axe des fréquences et pour chacune des abs- a 


cisses 20, 270,...,k10,..., plaçons en ordonnée l'amplitude 0,4 
4 4 4 … 


lak|. On a ainsi |a1] — lao| = et [an] = 


37” 157 (An2=1)r 
Le graphique obtenu est une décomposition en fréquences du 02! 
signal f. (figure ci-contre). o1! 
Pour l’abscisse v — k1,, il vient k — my : les points sont donc 
sur la courbe d’équation a — . 2 où a est l'amplitude.  U 1 2 D 


Exemple 2. Reprenons la fonction périodique de période 27 définie en posant g(x)= 
x pour tout ele 7,7]. D'après les calculs faits dans l'exemple page 555, sa série de Fou- 


rier est 257*%(—1)7+1SNnx SNNT Voici les graphes de g et des approximations en moyenne 
nm 


3 8 
= 9 > ( jet sinnx nr et = 9 > ii ie sinnt nzx 
n=1l 


=] 


Puisque la fonction est discontinue aux points r+2kr, l’approximation en valeurs y 
est nécessairement mauvaise. Remarquons aussi que sur de petits intervalles comme 
]r-h,x{ et ]r,r+h], l'approximation se dégrade : c’est un phénomène courant. 
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Dérivation et décomposition de Fourier 


On rencontre souvent des fonctions qui, sur [0,7], sont dérivables sauf peut-être en 
un nombre fini de points. Si de plus la dérivée est continue et bornée sur les inter- 
valles ouverts où elle est définie, on dit que f est continñment dérivable par morceaux. 
Puisque nous supposons que la dérivée est bornée, f’ est de carré intégrable sur [0,71. 
Voici des exemples de fonctions continüment dérivables par morceaux. 


1) Pour la fonction f(x) —|sinx|, on a f'(x) = cos x f 
si æ €]0,7{, mais aux points O,+7,...,+km..., f D 
n’est pas dérivable : il y a deux demi-tangentes de 7e z 


pentes 1 et —1. La fonction f est continue, périodique de période x et continûment 
dérivable par morceaux. 


2)La fonction périodique de période 27 définie en 
posant g(x) =x pour tout x E]-7T,7] n’est pas con- 
tinue en 7, non plus qu'aux points 7 +2kT, où 
k€ Z. Néanmoins, la fonction g est continüment dérivable par morceaux, car pour 
—7r <æx<7, la dérivée g'(x) = 1 est continue. 


BY 


Proposition. Si f est une fonction périodique de période T, continue et continâment 
dérivable par morceaux, alors ch(f") = ènw cn(f). 


Démonstration. Supposons par exemple que f a une dérivée continue sur ]0,a[ et sur 
Ja, T[, où a est un nombre tel que 0 < a < T. En intégrant par parties, il vient 


. f'(be tr iot di = fi se ee niv [| fe rietd 
0 0 


É a 
: f'He it de = [r(e tee] + niv | f(be-" ic de. 


: : = ; 
Ajoutons ces deux expressions. La somme des crochets est [ f(æ)e Mu , car f est conti- 


nue en a, et puisque f(x)e-"?#® a pour période T', on a fines). = 0. Il vient ainsi 


T | T à 
l'égalité | fe red niv | fe -riet dt, d'où c,(f') = niwc,(f). al 
0 0 


Conséquences. Soit f une fonction périodique. 

— Si f est continue et continûment dérivable par morceaux, ses coefficients an, bn et Cn 
sont négligeables devant 1/n. 

— Si f possède une dérivée f® continue sur KR, ses coefficients an, bn et Cn sont 
négligeables devant 1/n*. 


Plus une fonction périodique est dérivable, plus vite ses 
coefficients de Fourier tendent vers 0. 


Démonstration. Si f est continue et continûment dérivable par morceaux, alors d’après la 
proposition, on a le (f _ fénuw Cn(f)| a wn|cn(f)|. Puisque c,(f') tend vers 0 quand |n| 
tend vers +oo, il vient lim nlen( f)| = 0 : cela montre que c;(f) est négligeable devant 


In|—+oo 
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1/n. Il en va de même de a, et b, dont la valeur absolue est majorée par 2|c,|. 
Supposons que f a une dérivée k-ième continue (k > 2). On a alors c;(f"”) = inwc,(f) 
(inw)?c,(f) et de proche en proche, il vient c,(f(®))={(inw)*c,(f). On sait que w hole, (?)| _ 


lcn(f®)| tend vers O0 quand |n| tend vers +00, par conséquent |c, (f)| = o(1/n) 


Exemple. Pour la fonction f(x) — [sin | qui est continue et continûment dérivable 
2 _4 he cos 2nx 


par morceaux, la série de Fourier est n=1 m2] (exemple 1 page 557). On a 
T n° — 

An = — 4 : 3 et quand n tend vers l'infini, |a,| + —_ est négligeable devant 1/n. 
I An — An 


Produit de convolution 
Définition 
Si f et g sont des fonctions . à ral T]), leur produit de convolution 


f *g est la fonction définie par (f x g)( a. Le f(t)g(x—t) dt, pour tout x ER. 


C’est encore l'inégalité de Cauchy-Schwarz qui assure que le produit de convolution est 
bien défini. Comparer cette définition avec celle donnée page 409 pour des fonctions 
non périodiques. 


Propriétés 

i) Le produit de convolution est symétrique et bilinéaire : fxg=gxf, f+x(g+h)=(f+xg)+(f+xh) 
et fx (Ag) = À(F + 9). 

ü] On a (fxg)+*h= fx(gxh)  (associativité du produit de convolution). 

ïüi) Ê + En = Cn(f)en, pour tout n E Z. 

iv) Si f * g est de carré intégrable sur [0,T], alors F(f x g) — [etfhenta)] 


Démonstration. La bilinéarité résulte des propriétés de a et la | s'obtient 


en faisant le changement de variable u = x-—t. On a (f *g _ Lf" f(s)g(t-s) ds, d'où 
[CF + 9) x A] Ce) = r | [ stats) (a hab) dt 
_ A : | fs) 7 g(t—s)h(x-t) ai ds 
1 T Ts 
— T2 : fs) | g(u)h(x—s-—u) ul ds en posant { = s+u 
on ee à (5) [faune du) ds , 


car l'intégrale de 0 à T d’une fonction périodique de période T' s'obtient en intégrant sur 


n'importe quel segment de longueur T. Puisque (g x h)(x—s) = = =1f'a h(x—s—u) du, la 


dernière expression est 2 f° f(s)[(g + R)(x—s)] ds = [f x (gx h)](x), d'où l'associativité du 
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produit de convolution. Pour montrer (ii), écrivons 
T 
(f *en)(x =1f f() jee t) =} et enter gs 
T'Jo 


: Cr iye-"é a er ivzr — CPE ier. 
Supposons f x g € L?([0,T]). D'après [ïi), on a alors 
[ef * g)] En = (Fxg)+ken = fx(g+en) = fx [cn(g)en] = Cn(g) (FX en) = Cn(g)Cn(F) En 


en utilisant linéarité et associativité. Il s'ensuit c,(f x g) = cn(f)cn(g) pour tout n. ü 


Utilisation de la décomposition de Fourier 
La décomposition de Fourier s'utilise comme un changement de référentiel, car de 
nombreux calculs usuels sur les fonctions périodiques ont leur traduction au moyen 
des coefficients de Fourier. 
a) Si f est dérivable, dériver f se traduit en multipliant chaque c,;(f) par niw. 
b) Si l’on décale un signal dans le temps d’une quantité a, cela se traduit, pour tout 
n, par un déphasage de —nwa de son harmonique d'indice n : 
si fa(x) = f(x—a), on a en effet ce, (f,) = e "vec, (f). 
c} Convoler f avec g se traduit en multipliant c,(f) par c,(g), à condition que les 
produits c,(f)cn(g) forment une suite de carré sommable. 


d) Calculer l'intégrale — LI" | f() >? dt, ou l'intégrale — LI" f(t)g(t) dt, revient à calculer 


Pl, ou la somme 35% € ne 


Décomposer un signal périodique en série de Fourier permet de le filtrer, c’est-à-dire 
d'en éliminer les harmoniques de fréquences trop hautes ou trop basses. Les figures 
ci-dessous montrent un filtrage où l’on élimine l’harmonique de plus haute fréquence. 


la somme > 5%. UP) 


signal à traiter les harmoniques du signal signal filtré 


3.4 Convergence ponctuelle d'une série de Fourier 
La convergence de la série de Fourier au sens de la norme dans l’espace V, ou dans l’es- 
pace L? ([0,T]) , n'implique pas que, pour un nombre réel x donné, la série numérique 


des cn(f)e"?“? est convergente. Voici des conditions suffisantes pour que cela soit vrai. 


Proposition. Soit f une fonction continue et périodique de période T.. Si la série > |cn(f)| 
est convergente, alors pour tout x ER, on a l'égalité f(x) = DIX c(fje" er. 


n——00 
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niwT 


Démonstration. Pour tout ER, on a |c,(fje" | =|c,(f)|, 


donc la série Sc, (f)e 


est absolument convergente. Posons 


+00 N 
g(x) = 3 Cn(fhe 5% = Sx(x) + ÿ cn(fei%, où Sw(x) = D en(prerive. 
LR Inl>2N+1 n=-N 


La fonction g est périodique de période T'. Puisque ex fJeriur | = (f) 


on a [g(x)-Sw(x)|< 
2 or len(f)| pour tout x € R. Par hypothèse, la suite Kv =, >: len(f)| tend vers 
0, d'où 

x) quel que soit xEeR, |g(x) — Sx(x)| < Kw, avec lim Xn=0. 


N—+00 
Montrons que g est continue en raisonnant comme pour les séries entières, page 536. 
Étant donné € > 0, choisissons N pour que Kw <e. Si x et y sont des nombres réels, on a 


niwr 


e —e"i ni E< < 2sin — 2 (proposition page 39), donc on peut rendre l'écart [Sn (x)—Sn (y)| 


moindre que € à ne de choisir x et y assez proches. D’après l'inégalité (+), l'écart 


g(æ)—g(y)| est alors moindre que |g(x)—-Sn(x)| + [Sn (æ)(x)—Sx(y)| + [Sn (u)—g(y)| < 3€. 
Pour un entier k donné et N >{k|, on a SN -ex; =cx(f) par définition de S\ et g-ex = cx(g). 
Il vient |e(g) — ex (f)| = (9 — Sn): ex] < g-Sxl lex] =11g9-Snil. D'après (+), les fonctions 
SN approchent g par valeurs sur R, donc la norme |g-SY|| tend vers 0 quand N tend vers 
+00. Il s'ensuit cx(f) = cx(g) : les fonctions f et g ont mêmes coefficients de Fourier. Comme 


f et g sont continues, la proposition page 551 affirme que f(x) = g(x) quel que soit x. 


Théorème. Si f est périodique de période T, continue et continûment dérivable par 
F0  Cn(f)e it? quel que soit x ER. 


morceaux, alors f(x) = D, 

Démonstration. Les coefficients de Fourier de f’ sont c,(f') = inwc,(f). D'après le 

théorème de Bessel appliqué à la dérivée f', la série 9° [en ( f: >? est convergente, donc 
2 n. E ; 

aussi la série Ÿ Inen(f)| . Mais si u et v sont des nombres réels, on a 2|uv| < u? + u?, 


car (u+v)? > 0. Appliquons cette inégalité à u = [nc,(f)| et v = Lu pour n #0. Il vient 
n 


2lc,(f) =2|nc, (f)| L< Inc (f)l+ _ . La série de terme général 1/n°? est une série de Riemann 
convergente et la somme de deux séries convergentes est convergente, donc, par le théorème de 
comparaison page 528, la série ÿ° en (f )| est convergente. D'après la proposition précédente, 
quel que soit le réel x, f(x) est donc la somme de la série de terme général c,(f)e"î?. m 


_ 2 _4 DD COS . 


Exemple. Pour la fonction |sinx|, on a ainsi l'égalité a 
An 


quel que soit x€R. En effet, la série de Fourier converge ne car [as |=(1/Tn? 
et la série de Riemann de terme général 1/n? est convergente. 
Effectivement, sur les figures de l'exemple 1 page 557, les approximations de Fourier 


semblent bien tendre en tout point vers la fonction. 
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Comportement en un point de discontinuité. Concernant la convergence de 
la série de Fourier en un point de discontinuité de la fonction, on a le résultat suivant. 


Théorème de Dirichlet. Si en un point xo, la fonction f a une limite à gauche 
€_= lim f(x) et une limite à droite {, = lim f(x), ainsi que des demi-dérivées à gauche 
T—T0 


T—T0 
T<T( T>xQ 


et à droite, alors la somme de sa série de Fourier en xo est SU + #_). 


Exemple. La fonction g de l'exemple 2 page 557 possède au point r (par exemple), 


une limite à gauche {_ = 7 et une limite à droite £/, = —7 : pour x = 7, tous les 


termes de la série de Fourier sont nuls, donc aussi sa somme. La série de Fourier de 
—1)"sinnx sin n(x+T 
g est —25 Eee. 25 si een : elle converge pour tout x, car 
FT É nm 
la série d’Abel ÿ:,., TT est convergente quel que soit y (proposition page 530); 
FF n 


mais si y Z 0 modulo r, la série n’est pas absolument convergente. 


Ondelettes de Haar 


Nous avons vu que la décomposition de Fourier permet d'analyser des signaux pé- 
riodiques de variable réelle. Voici une technique élémentaire pour traiter, de manière 
analogue, des signaux discrets, c'est-à-dire constitués d’une suite finie de valeurs 
réelles fo, f1,...,/,. Nous considérerons un tel signal discret comme une fonction 
constante par morceaux. 

Donnons-nous un entier N > 1 et partageons l'intervalle [0,1[ en parties égales à 
l'aide des 2V points 


1 nr: ENT 1 
JM tee RP Que ete RONA oN ON 


zo = 0, &1 = 


Notons En l'espace vectoriel des fonctions à valeurs réelles, définies sur [0,1[ et 
constantes sur chacun des intervalles [x4,2%11[, où 0<k< DNS pour fEEN,ona 
f(x) = fr si tr LT < ïx11, pour tout entier k tel que 0 < k < og. 

1 
Pour toutes fonctions f et g appartenant à En, posons f - g = 4 f()g(®) dt. 


Cela définit un produit scalaire et En devient ainsi un espace euclidien (chapitre 7). 
Une base de En. Considérons les fonctions @N,k définies par 


i Tk < £k<I2N 
exate) = {1 si xp Lx <rpu te 0Lk<L2 1 


O sinon 


Si une fonction f € En vaut f, sur [xx,xx[, alors pour tout x € [0,1], on a 
N_ 
f(x) = PB fr wnkx(x), autrement dit toute fonction dans En s'écrit de manière 


; ie —. 2N_ 
unique comme la combinaison linéaire f = 3 5 fk£nk. 
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Les fonctions ww, forment une base de Ex. On a donc dimÆEn — 2N. 


1 2,0 1 2,1 1] 92,2 1 P2,3 
1 1 1 1 
= = 


To Li Lo L3 T4 L To T1 T2 T3 La L To 1 T2 X3 T4 À To 1 Lo T3 La L 


Si k et { sont des entiers différents, les intervalles [x4,%x+1| et [x,%e411[ sont disjoints, 
donc pour + dans [0,1[, l’un au moins des nombres onk(x) où ne(x) est nul. Ainsi 


1 
la fonction produit on,kwn,e est nulle et par suite @n k:@Ne | pn,r(t)pn,e(t) dt =0. 
0 


1 
D'autre part, | Lena (t)]” dt = Ty+1—Tr = ni d’où 
0 


__f0 sik ££ 
PN,k' PNE — 1/2N Er — 


Pour 0O£<k< Na, les fonctions @N,x forment une base de En et sont deux à deux 
orthogonales. 


4.1 Génération des ondelettes 


On part de l’ondelette-mère : c’est la fonction Ÿ définie sur l'intervalle [0,1] en posant 


_f 1 s0<x<1/2 
vo) = { si1/2<x<1 


Pour obtenir la première génération d’ondelettes, on reproduit dans chaque moitié 
de l'intervalle [0,1] une fonction semblable à Y : 
- sur [0,1/2[, on obtient la fonction #10 qui vaut 1 
1 sur [0,1/4[, —1 sur [1/4,1/2[ et O ailleurs, 
- sur [1/2,1[, on obtient la fonction 411 qui vaut 
1 sur [1/2,3/4[, —1 sur [3/4,1[ et O ailleurs. 


Chacune des fonctions 41,0 et #11 est constante sur les intervalles [0,1/4{, [1/4,1/2{, 
(1/2,3/A[ et [3/4,1[, donc appartient à l’espace E2. 
Poursuivons l'opération en faisant jouer à %1,0 et 11 le rôle de mère. La fonction 


10 donne naissance à deux fonctions %Y20 et Y1 : 

— V0 vaut 1 sur [0,1/8[ (première moitié de [0,1/4]), —1 sur [1/8,1/4f et O0 ailleurs; 

— V1 vaut 1 sur [1/4,3/8[ (première moitié de [1/4,1/2[), —1 sur [3/8,1/2[ et 0 
ailleurs. 
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De même, la fonction 411 donne naissance à 421 sur l'intervalle [1/2,3/4[ et à 422 sur 
(3/4,1[. Les quatre fonctions de cette deuxième génération appartiennent à l’espace E:. 


2,3 
0,25 L 0,5 . 0,75 + 
TT 


À la N-ième génération, on trouve 2N fonctions VN,k, Où OLE< 2N_1, appelées 
ondelettes de Haar : la fonction Ÿn, vaut 
1 sur la première moitié de l'intervalle [k/2N,(k+1)/2NT, 


 —1 sur la seconde moitié, 


— 0 en tout autre point de [0,1{. 
La formule générale est 
ee a si k/2N < x < (k+1)/2N 
0 sinon 
Puisque nx est constante sur tous les intervalles [j/2N*1,(5+1)/2N%1T pour 
j=0,... ,2N+121, c'est un élément de l'espace En1. Remarquons qu'une ondelette 
est de moyenne nulle, car l'intégrale de Ÿ\, entre 0 et 1 est égale à 0. 


Terminologie. Si une fonction définie sur [0,1] est nulle hors d’un intervalle [a, b[ 
inclus dans {0,1[, nous dirons qu’elle est à support dans [a,b]. Ainsi la fonction Ywx 
est à support dans [k/2N,(k+1)/2N]. 

Supposons que uw est une fonction à support dans [ab], que v est à support dans 
[c, d] et que les intervalles ouverts Ja, b[ et ]c, d[ sont disjoints : on dit alors que u 


et v sont à supports disjoints. Dans ce cas, le produit u(x)v(x) est nul sauf peut-être 
1 
sib=c=x et par suite Î u(t)u(t) dt = 0. 
Dans EN, deux fonctions à supports disjoints sont orthogonales. 


Puisque Ÿxk est à support dans (tr, tk], Ynx et Wne ont des supports disjoints 
si k Z L. On en déduit : 


pour D<Kk< 2N 21, les ondelettes Ynx sont deux à deux 
orthogonales dans l'espace En1. 


4.2 Décomposition en ondelettes 


Rappelons que pour tout entier £ —0,1,... ,2N 1, nous avons noté ww la fonction 
appartenant à EN qui est constante de valeur 1 sur [x4,%%:1| et qui vaut 0 ailleurs. 
Ces 2 fonctions sont deux à deux orthogonales. 

Remarquons que tout élément de En est aussi élément de En.,1, car une fonction 
constante sur un intervalle l’est aussi sur chaque moitié de cet intervalle. Ainsi Ex 
est un sous-espace vectoriel de Ex:1. 
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Une base de E N+1-. Considérons dans EN,: la famille formée des 6,4 et des 
ÙNx, où DLKk< 2N_7 (pour N = 2, voir les figures pages 563 et 564). Calculons 
le produit scalaire de deux quelconques de ces vecteurs. 

— Si k££E, alors Enr one dr DN,=0, car les fonctions sont à supports disjoints. 
— Pour la même raison, on a ox : Yn.e = 0 si k Æ L. 

On a aussi @n,x : VN x = 0. 


En effet, puisque @n,k(x) vaut 1 sur [x4,%x41[ et 0 ailleurs, il vient 
Tk+1 


1. Enk(t)Un,k(t) dt = [. Ynx(t) dt = 0. 


2 2 
e EN RENE ER UNE ÉN car len,k(x)| =|Yn(x)| —1 pour tout rElrx,2g+1l|. 


Ainsi, en mettant ensemble les wnx et les Ye, on obtient des vecteurs deux à deux 
orthogonaux dans En. Puisque aucune de ces fonctions n’est la fonction nulle, on en 
déduit que ce sont des vecteurs indépendants (proposition page 205). Le nombre de ces 
vecteurs est 2V+2N = 2N+1 qui est la dimension de Ew,:, donc 

la famille des on, et Wnx est une base de En: et 

ces vecteurs sont deux à deux orthogonaux. 


Décomposition d'un signal. Rappelons que l’espace vectoriel Ex,1 a aussi pour 
base les fonctions &n1,;, où 0 < 5 < 2N+1_ 1, L’entier N étant donné, posons pour 
simplifier p = 29, 

D; — onu, pour 0 < j < 2p—1, op = onyx et dr = Vn,x pour 0 <k < p—1. 


Tout signal f appartenant à En.1 se décompose de manière unique en 


2p—1 p—1 p—1l 
(x) F= NS; =  axpe + D bebr 
5=0 k=0 k=0 


Entre une fonction ®; et l’une des fonctions 44 ou w», les seuls produits scalaires 
non nuls sont 


1 L —1 
Pak: Ph = PVR D PH PRE 2 et RE 
Ÿk PK Por  Porri 

! l [l ! l i | 

-u2p — 1» — TE 
RE > ne SN ENT PNR 
Tk 1/2p=! Tk+1 Tk Tk+1 Tk Tk+1 

[l 


En multipliant scalairement par 2; dans (+), il vient donc 
Ê Por — for Por : Por = ax Por : Pr + br Por + Vr = Le, + 13, 
2p 2p 


De même, en multipliant scalairement par 4,1, on obtient 
É : Borri — for Port * Porn = Ar Porsi * Dr + br Pari * Vr = 74 — TU 
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Puisque ®;-®;— _ on a simplement les relations f2,=ax+bx et foxs1 = ax —0bx, d'où 
D 


ak = D É 4 Shu et br = ES = sh, pour 0<K< p—1. 


Ce sont les formules du changement de base. La fonction Pn(f) = vo GkPk ap- 
partient à En et f—Pn(f) = 5 bxyx est orthogonale à En. D'après le théorème 
de la projection (page 209), on en déduit : 

p-1 

S axgr est le projeté orthogonal de f sur le sous-espace Ex. 

k=0 


2N+L ; si l’on veut 


La fonction f est constante sur des intervalles de longueur 1/ 
approcher f par des fonctions constantes sur des intervalles de longueur double, la 


meilleure approximation au sens de la norme dans En1 est Pn(f) — ne AkPk. 


On peut bien sûr poursuivre la décomposition en projetant P\(f) sur En-1 et ainsi 
de suite. Cela conduit à calculer les coordonnées de f dans la base de Ex:1 formée 
de la constante 1, de 4 = Ÿ et de tous les #,,4,, où n —=1,2,...,N et 0<k<27-1 
(le nombre de ces fonctions est bien 1+1-4+2+22+...+9N = 9N+1 2 dim Ewu1). 


On peut définir d’autres types d’ondelettes en choisissant comme ondelette-mère une 


courbe convenable. Cela permet, comme la décomposition de Fourier, d'analyser aussi 
des signaux continus. 


Exemple. Prenons N — 2. Pour tout signal discret f —{[f;lo<;<r appartenant à E3, 
les coordonnées à, a1,a,a3 et bo, b1,b2,b3 sont données par le produit matriciel 


1/2 0 O0 O0 1/2 0 O0 0 

1/2 0 O0 O0 1/2 0 O0 0 

0 1/2 0 O0 0 1/2 0 0 

0 1/2 0 O0 O0 —1/2 0 0 
[aoai a2a3bob1b2b3] =] fo fi fo f3 fa fs F6 fr] 0 / 1/2 0 0 : 1/2 0 

0 O0 1/2 0 O0 O0 1/2 0 

0 O0 0 1/2 0 0 0 1/2 

0 O0 0 1/2 0 0 O0 —1/2 
Écrivons cela sous la forme condensée [a b] = {f]H, où l’on a appelé H la matrice 


8 x 8, posé a = [ao a as a3], b = [bo b1 b2 ba] et noté [f] le vecteur-ligne constitué des 
valeurs du signal. 


Plus généralement, introduisons la matrice carrée H={[h;;] de taille p=2"*1 définie par 
1/2 si j <p/2 et i = 2j—1 ou 2j 

1/2  sij>p/2eti—=2j-p-1 

—1/2 sij>p/2eti=2j-p 

0 sinon 


hij = 
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En employant les notations introduites dans l'exemple, les formules qui permettent 
de calculer les a; et les by; s'expriment par la relation matricielle 


[a b]={f]H, où le signal f est de taille p. 


Puisque H est une matrice de changement de base, elle est inversible. 


Interprétation de la décomposition 


Soit f = [fo, f1,..., fox _1] un signal discret de longueur 2". Si l’on veut approcher 
f (au sens de la distance dans EN) par un signal de longueur moitié, le meilleur 
choix est le projeté a = [ao, a1,...,aon1 1], où ax = sf + sf. 

Puisque ax est la moyenne de deux valeurs consécutives de f, le signal a est plus 
régulier que f : des détails de f n’y apparaissent pas, mais on y retrouve l'allure 
principale du signal initial. 

L'information de détail est exprimée dans le signal b. Si f est assez régulier, des 
valeurs consécutives fx et f2711 Sont voisines et les termes b; sont petits. 

La figure de gauche ci-dessous montre le graphe d’un signal f échantillonné sur 
2 — 32 points : la fonction est constante sur chacun des sous-intervalles de partage. 
Au centre, on voit le graphe de la partie principale : c’est une fonction constante sur 
seize sous-intervalles de longueur double des précédents. Les détails sont représentés 
par le graphe de droite, où la fonction est une combinaison des seize ondelettes 
Ya, k=0,...,15. Il y a plusieurs intervalles où cette fonction de détail est nulle, 
correspondant aux valeurs de k telles que bx — 0. 


> 
un signal f l'allure principale a les détails b 


4.3 Application à la compression d'images 


On numérise une image en la découpant en 2Ÿ x 2N pixels répartis en 2Ÿ lignes, 
chaque ligne comprenant 2 pixels. Dans le cas d’une image en noir et blanc, on as- 
socie à chaque pixel un niveau de gris qu’on peut repérer sur une échelle convenable 
(formée par exemple d’entiers entre 0 et 255 ou par des nombres entre 0 et 1). L'image 
est ainsi définie par une matrice carrée de taille 2V. Pour une image en couleurs, 
il suffit de considérer trois images formées des niveaux dans les couleurs primaires 
(rouge, vert et bleu). Supposons désormais que notre image est en noir et blanc. 


Traitement par ondelettes. Soit 1/ la matrice qui définit l’image. Chaque ligne 
et chaque colonne est un signal de longueur 2V que l’on peut décomposer comme 
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précédemment. Une ligne L se décompose en LH et une colonne C' en (*H)C, donc 
la matrice M se décompose en la matrice M' = (*H)MH. 


À partir de M', on retrouve M par le produit matriciel (*H)-!M'(H-1) = M. 

Posons M'— É LE où À,B,C,D sont des matrices carrées de taille 2N-1. 

- l'allure principale de l’image est donnée par la matrice À et l'information de 
détail se trouve dans les matrices B, Cet D. 

L'image se présente en général sous forme de zones relativement homogènes où 
l'intensité varie peu, séparées par des lignes de contour où la variation d'intensité 
est brutale. Dans une zone donnée, chaque pixel a donc des voisins à peu près 
de même valeur. Il en résulte que dans les matrices B, C et D, la plupart des 
coefficients sont petits, voire nuls, car dans M, la différence entre deux coefficients 
successifs sur une même ligne ou sur une même colonne est petite : on dit que 
ce sont les coefficients de détail. 


Principe de la compression 


A priori, l'image est définie par 2" x 2N nombres. Mais donnons-nous une tolérance 
€ > 0 et remplaçons par 0 tous les coefficients de détail dont la valeur absolue est 
moindre que €. La matrice M' devient 
1! A B 
Mes |6, D: 
où les matrices B., C: et D: contiennent beaucoup de zéros : pour cette raison, on 
dit que ce sont des matrices creuses. 


Pour définir une matrice creuse, il suffit de se donner les indices et les valeurs des co- 
efficients non nuls, en convenant que les autres coefficients sont nuls : c'est une donnée 
beaucoup moins volumineuse que la matrice elle-même, de sorte qu’une fois numérisée, 
cette information génère un fichier de données plus petit que si l’on y avait indiqué la 
valeur de chacun des coefficients de M. 


La matrice creuse M! contient les coefficients principaux et peut se coder 
de manière beaucoup plus économique que M. 


À partir de la matrice M!, on peut reconstituer une image un peu dégradée en 
effectuant le produit M. = (*H)-'M!(H° |) et en interprétant les coefficients de M. 
comme des valeurs de gris pour les pixels. 

En acceptant une image de moins bonne définition, il est donc possible de diminuer de 
façon significative le volume de l'information et de gagner ainsi en rapidité de trans- 
mission. C’est sur ce principe que fonctionnent les logiciels de compression d'images. 


Algorithme de compression 
initialisations : 


M + la matrice carrée de taille p—2" correspondant à l’image initiale numérisée 
e >0 + une tolérance 
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[ms] (CH)MH 
ü) boucles : pour à = 1,...,p, pour j =1,...,p 
si à > (p/2)+1 ou si j > (p/2)+1, alors 


si [m;;| <e, faire m/, + 0. 
ü) fin : M" (H) mi,](HS. 
À la fin de l'algorithme, 


1J 
A 


— la matrice M'=—[m;;] contient une version compressée de l’image : c’est la matrice 
qu'on peut transmettre par voie informatique ; 


- la matrice M” représente une image dégradée avec tolérance €. 


Exemple. On a codé l’image d’une tête de marmotte au moyen d’une matrice 
carrée M de taille 32. Les degrés de gris ont été repérés sur une échelle de 0 à 1 


et l’on a choisi la tolérance € — 0,1. 


Dans la matrice M! _ | À . L les sous-matrices B., C: et D: sont bien creuses : 


dans B:, il n’y a environ que 7,4% de coefficients non nuls, dans C4, il y en a 4% 
et D. — 0. Au total, la matrice M! n’a que 27,8% de coefficients non nuls (dont 
les 25% de coefficients principaux qui n’ont pas changé). On voit que, malgré la 
compression, l’image se dégrade peu. 


5 10 15 20 25 30 5 15 20 25 30 


avant compression après compression 


a Exercices emammmmmmnx 


1. Calcul approché de la somme ur série Dans l'exemple page 530, nous avons montré 


: l l a : 
ue si a >0 , alors < Arctan — pour tout entier p > 1. 
q 2. Re) a? +p? * a p P p Z 
Montrer “sé pour tout x > 0, on a l'encadrement 0 < Arctanx < x. En déduire 


 . ” en - <2/p puis, au moyen d’un ordinateur, une valeur approchée à 2.107? 


près de . somme »,* ne 


@ 2. Développement en série entière et suite récurrente linéaire. Soient p et q des nombres. 
1 


q+pr+r? | 
a) Montrer que si |x| est assez petit, f(x) est bien défini. 


On suppose q £ 0 et pour tout x, on pose f(x) = 
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b) Montrer que pour une série entière V'atr , On à (q+pr+x? PT = 1 si et 
seulement si gao = 1, qai + pao = 0 et gax+2 + pary1 + ax = 0 quel que soit k > 0. 
En déduire que ie Ix| assez petit, on a le développement en série entière 


rt sr 0 axt* 
g+pr+x 


c) Montrer que le début du développement en série entière de f(x) est 
= g+p? _9g+p? 2 _90n2 pt 
mu p( P),s, 8 gp'+p a. 
gHptæ ta 4 ( q d 


3. Les nombres de Fibonacci. On définit les nombres de Fibonacci F, en posant F6 = 0, 


F=let F2 = Fr + Fr pour tout entier k 20.Si k>0, Fy est un entier positif. 


T 


a) Montrer que pour |x| assez petit, le développement en série entière de = 
—T—T 


est +. Fyx* (multiplier cette série entière par 1—x—2). 


2 


b) Calculer les racines de 1—r—x? et montrer que l’on a x?+—1 = (x+a)(x+/8), 


LS 1- 5 


où «a = et B — 


. Vérifier les relations «+6 = 1 et af = —1. 


c) Vérifier l'égalité = —= 3 É A . En déduire le développement en 


= = a (ati BK xË (utiliser le A en sé- 
—T—X 


rie entière de —1-), Montrer finalement que l'on a —"—— = 2 (a*—6*)x* 
a—2Z 1—x—-x a— B 


série entière 


pour |x| < ||. G+V5)E — (1-5) 


VE 
La fraction de droite est donc un nombre entier, car les nombres de Fibonacci sont 
par définition des entiers. 


d) En déduire que pour tout entier k > 0, on a l'égalité F7 = 


4. Utilisation d'une série génératrice. Soient p, q et r des entiers strictement positifs. Étant 
donné un entier n > 0, on note w, le nombre de solutions (x,y,z) de l'équation 
pr + qy + rz = n, où les inconnues x,y,z2 sont des entiers positifs ou nuls. 


a) Écrire le développement en série entière de la fonction tr _. Quel est le rayon 
de convergence ? 


b) Montrer que u, est le coefficient de {” dans le développement en série entière 
1 
de 


GP) 00) 
c) On prend p=2, q=3, r —5. Vérifier que l’on a par exemple u20 = 11, u20:x = 10+k 
pour 1<k <9 et u30o = us1 = 21. 


@ 5. Un problème de file d'attente. On considère un guichet où des clients se présentent 
à des instants numérotés 0,1,2,... Les arrivées sont aléatoires, mais on suppose 
qu'entre deux instants consécutifs n—1 et n, il y a toujours la même probabilité p 
qu'un client se présente. 

On appelle durée de service d’un client le temps passé au guichet à le servir On 
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suppose que ces durées sont des variables aléatoires D indépendantes qui suivent 
une même loi de Poisson, c’est-à-dire de probabilité 
nm 
P(D = n) = sa , pour tout entier n > 0, 

n! 
où À est un paramètre strictement positif. 
La première vague de clients est formée des personnes arrivées pendant le temps de 
service du premier client et la (k+1)-ième vague est formée des personnes arrivées 
pendant la durée des services des clients de la k-ième vague. 
Notons Ny4 le nombre de clients de la k-ième vague, en convenant Mo — 1. 


a) Soit D la durée de service du premier client. Montrer que la probabilité 
pour que N; = k sachant que D =n est P(N=k|D=n) = (?)pf(1-p} À 


(rappelons que le coefficient binomial (}) est nul si k >n). En déduire 


co fn c n=k,-x À" 

PM =) = 25% (e)p*(1-p)" Fe de kyn—k 
MD too (LIT N 

El n=k (n—k)! d 


k 
. En déduire que l'espérance de MN; est À. 


b)En écrivant la somme ci-dessus sous la forme e- 


= Xp (Ap) 


montrer que P(N =k)=e Fr 


Posons px — P(Nx = 0). S'il n’y a personne à la k-ième vague (N4 = 0), il n'y a 
personne non plus à la vague suivante (N4:1=0) : on a donc px <px+1. La suite des 
probabilités p4 est croissante et majorée par 1, donc les p4 ont une limite. La réunion 
de tous les événements N; — 0 pour k—1,2,... est l'événement « la file d'attente 
s'achève en un temps fini» : la probabilité de cet événement est donc ue Pr. 


c) Supposons que la première vague contienne j clients. Dire que la (k+1)-ième 
vague est vide signifie que lorsqu'on fait jouer à chacune de ces j personnes 
le rôle d’un client initial, la k-ième vague est vide : la probabilité pour que 
Nx1 = 0 sachant que N; = j est donc [P(Ne — 0)}’ = (px). En utilisant l’éga- 
lité P(Ny41 = 0) = à P(Nyu =0|NM = )j)P(N; = j), montrer que pour tout 

| xp CP} ee 
k>0,ona Pki1 = pe (pk)’e us = eP(Pr D, où po = 0. 

d) Reportons-nous à l’exercice 3 page 337 où l’on a étudié, en fonction du paramètre 
a >0, la suite (uzx) définie par l’itération ux+1 = etux—1) et la valeur initiale uo —0. 
En utilisant les résultats de cet exercice, 

(i] justifier l'affirmation suivante : si Àp < 1, il est presque certain qu’au bout d’un 
temps fini, le guichet se libère ; 

(iü) vérifier le tableau ci-dessous où figurent, pour quelques valeurs de p et de À, des 
estimations de la probabilité pour que le guichet se libère au bout d’un temps fini. 


p = 0,3 p=0,5 | p=0,75 


\=4 | 0,68 0,20 0,06 
X=5 | 0,42 0,10 0,02 
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@ 6. Une propriété des polynômes de Legendre. Pour tout nombre 2, on définit la fonction 
V(h) = (1-2:h+h?) //?, où la variable h est réelle. 
a) Montrer que (1-22h-+n?) = (2-h)V. 
b) La fonction V est développable en série entière : montrer que les coefficients 
sont des polynômes en z, autrement dit que si |h| est assez petit, alors 


V(h) = Qo(z) + Qi(2)h+ Qo(2)h? +... + Qu(2 hf +... où Qo,Q1,Q2,... sont des 
polynômes. Calculer Qo et Q1 et vérifier que l’on a Q2(z) = (3/2)z2—(1/2). 


c) Montrer que le coefficient de h" dans (1-2zh+h?) est 
(n+1)Qn+1 ai 2nzQn FT (n—1)Qn_1 - 


Déduire de (a) que les polynômes Q, satisfont la même relation de récurrence 
que les polynômes de Legendre : (n+1)Qn+1 = (2n+1)2Qn — nQn-1. 
dj Soit z un nombre donné. Montrer que si |h| assez petit, alors 
(1—22zh+h2) 1/2 2 p,(2) + Pi()h + Pa)? + + PC hf + 


où P5, Pi, Pr,... sont les polynômes de Legendre. 


@ 7. L'équation différentielle d'Airy. Il s’agit de l'équation y” + xy —0 (exercice 11 page 158 
et exercice 5 page 473). Cherchons des solutions sous la forme y(x) = 5% anx". 
a) Montrer que les a, satisfont la relation (n+2)(n+3)ah3 + an = 0 pour tout n > 0. 
b)En déduire que la solution telle que y(0) =1 et y(0) —0 est la fonction 


_ +00 n x : ve 
A(x)=1+5;,"(—1) 73-56 (n Dm) et que cette solution est définie sur R. 


6 
Les premiers termes de la série sont 1— + fo — +. 


3n 
P = N n T = > . : . 
c) Posons An(x)=1+5:,_(—1) 3.5.6... (@n-DGn)’ où N>1. Faire dessiner par 
ordinateur le graphe de la fonction A9 sur l'intervalle [—2,5]. 


Montrer que si a >0, alors pour tout x € {[0,a], on À 
3N+3 
a |[A(x)—-An(x)| < È . Après avoir 
A(&)—An(x)| < 2:3.5.6...(3N+2)(3N+3) P ” 2 1 4 x 


trouvé une majoration convenable de l’écart |A(—2)-A9(—2) : 
ee _ graphe de A(x) 
vérifier que pour —2 < x <5, on a |A(x)—Ao(x)| < 6.107?. entre —2 et 5 
8. Soit f un signal périodique de période T°. On décale f dans le temps d’une quantité a 
en posant f,(x)= f(x—a). Montrer que pour tout entier n, on a ch(fa)=e "°c, (f). 


9. Soit g la fonction périodique de période 27 telle que g(x)=x si —r <x<m (exemple 
2 page 557). Utiliser la série de Fourier de g pour montrer que lorsque 0 < x <#, 


DATE +00 SiNnT __T_X 
on a l'égalité 377  — 


@ 10. Calcul d'une série de Fourier. Posons u(x) — Tx(r-x) pour 0 < x < r. On prolonge 
: p prolong 


u en une fonction f impaire et périodique de période 2r. 
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11. 


a) Montrer que pour tout entier n, on a e f() sin nt dt — 2 1 u(t) sin nt dt. 
TT 


T 
b) Montrer que Î u(t)sinntdt vaut 0 si n est pair et 75 si n est impair. En 
nm 
sui Loi , sin(2n + 1)x 
déduire que pour 0 < x < T, on a l'égalité Se(T—x) Re Pa , 


(—-1)" T° se dl _ 7S 
n=0 (2n+1)5 960 


4 LA +00 
c) Montrer les égalités 37," Qnti — 3 et 
Oscillations dans un bassin rectangulaire. On laisse osciller librement la surface de l’eau 
dans un bassin rectangulaire de longueur a, de largeur b et de profondeur h. Choi- 
sissons des axes Ox et Oy comme sur la figure ci-contre. 
L'élévation de l’eau au dessus du niveau de repos est une 
fonction Z{x,y,t) = cos(wt+w)u(x,y) solution de l'équation 


2 2 2 
92 AZ, oùc=/ghe AZ-92}02, 


v) 


ot? 0x” 0y" 
De plus, en un point de la paroi, il n’y a pas de déplacement dans la direction 
perpendiculaire à celle-ci : on a donc les conditions aux bords ou = 0 si x — 0 ou 
LC 


x = a, et D =0 si y = 0 où y = b. 


2 
a) Montrer que l'équation s'écrit Au + #u = 0. 
é 


b) Cherchons une solution sous la forme «u(x,y) — A cos(ax+41) cos(By+4), 
où À est une constante. Montrer que les conditions aux bords imposent 


L. L , 
u(x,y) = Axe cos (Eee) COS (=), avec k et { des entiers. 


2 2 
c) Calculer Au et en utilisant (a}, montrer que uw? = rc [E+£] . En déduire la so- 
; TT { % . 
lution Z%,e = Az, COS (E) cos (=) cos(wx st + px.e), où k et £ sont des entiers 
(0 
À k2 £2 | 1/2 
et où wy =re[5+£ : 


d) Expliquer le premier mode d’oscillation de la surface de l’eau (a > b, k=1 et 
{= 0) : il y a une seule vague longitudinale qui va et vient, avec un noeud à 
mi-longueur de bassin (x — a/2). 

On peut voir un autre mode d’oscillation sur les figures 2 et 3 page 360. 

En décomposant la fonction u(x,y) en double-série de Fourier, on montre que la 
solution générale est de la forme Due Zx,e, la sommation se faisant sur tous les 
couples d’entiers k, £. 


@ 12. Calcul d'une solution périodique d'équation différentielle. On considère l'équation diffé- 


rentielle linéaire y” — 2y + 2y = |sin(t/2)|. Le second membre étant 27-périodique, 
cherchons une solution 27-périodique t+ f(t) sous la forme de son développement 
de Fourier f(t) = D,e7 Cne°"". 
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+00 
2 4 cos nt 


à 
Ti 4n°—1 


a) Montrer que pour tout {, on a |sin(t/2)| — 


b) En déduire que les c, doivent satisfaire les relations co = a et (n2—2 +2ni)Cn = 
T 


D À 
T An? 
Admettons les résultats suivants : 


jour €Z, n #0. Calculer la partie réelle et la partie imaginaire de c,. 


- sin°|c,| a une limite finie quand n tend vers +c, alors f a une dérivée continue ; 


- si n'|[c,| a une limite finie quand n tend vers +co, alors f a une dérivée 
seconde continue. 


L 
d) Montrer que la fonction f(t) + 4 5e )cosn ee DE AL sin re 


est solution de l'équation différentielle. 


@ 13. La formule de Poisson. Soit À : R — KR une fonction continue. Supposons que lorsque 
x tend vers +oco, h(x) est négligeable devant 1/|x[%, où a > 1. 


a) Soient a > 0, æ E [—a,a] et n| > a. Montrer que |x+n| > |n|—a. En déduire que 
les nombres n°|h(x-+n)| sont majorés quand x parcourt [-—a,a] et quand n par- 
court Z. Conclure qu'il existe une série Sa, — > M/n° convergente telle que 
[h(æ+n)| < an pour tout n € Z et tout x € [-a,a]. La série D A(x+n) est donc 
absolument convergente quel que soit x € R. 


b} Pour tout x ER, posons f(x) = 5 *° . h(x+n). 
il Montrer que la fonction f est périodique de période 1. 
ü) Pour tout entier relatif p, écrivons c,(f) = un + An, où 


N 


Un = FN | ÿ h(tn)| e 2iTPi dt et An = L | >. CE] Pa dt. 


= N m>N 
Montrer que |An| < LIEN än. En déduire Jim [An] = 0. 
—+00 


1 : n+1l : 
ü) Montrer que Î h(t+n)e-?i7rt d= | L h(s)e-??TPs ds. En déduire 


N+ dé 
Un . h(s)e-*?TPs ds. 
(iv) En utilisant l'hypothèse faite sur h, montrer que l'intégrale généralisée 
+00 
’i h(s)e-2iTPS ds existe. 
60) 


+00 


c) Pour tout entier p € Z, posons h(p) =) h(s)e-? TPS ds. Déduire de (b} (ii) et (iii) 


que l’on a c(f) = h(p). L 


d) Supposons de plus que la série \A(p) )| est convergente. Montrer que pour tout 
xER, on a l'égalité D h(rtn)= DE, h(n)e??T"%, En déduire la formule 
de Poisson : 5% h(n)= 5%. h(n). 
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@ 14. Utilisons les notations du paragraphe sur les ondelettes (page 567). 
Soit f € En et soit [ab] la décomposition de f en partie principale a et détails b. 


a) Montrer que ||f||? = |la||? + ||b||?. 


b) Montrer que les signaux f et a ont la même moyenne, autrement dit 


[ (€) dt = a a(t) dt. 
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1. Fonction de Gauss 


Annexes 


Table de valeurs de la fonction de Gauss D(x) — — [ Ed, 
T —O00 


0,0 


®(x) |0,5000 


0,1 0,2 


0,5398]0, 


5792 


0,3 
0,6179 


0,4 


0,5 


0,655410,6914 


0,6 
0,7257 


0,7 
0,7580 


0,8 


0,7881 |0,8159 


0,9 


1,0 


®(x)|0,8413 


11 
0,8643|0, 


iS 
8849 


1,3 
0,9032 


14 


1,5 


0,919210,9331 


1,6 
0,9452 


1,7 
0,9554 


1,8 


0,9640 |0,9712 


1,9 


2,0 


®(x) |0,9772 


ji 


0,9821 0, 


25 


9861 


2,3 
0,9892 


2,4 


2,5 


0,9918|0,9937 


2,6 


0,9953 


2,7 


0,9965 


2,8 


0,997410,9981 


2,9 


Pour les valeurs négatives de la variable, utiliser la relation D(—x) — 1 — (x). 


2. Fonctions de Bessel 


Voici les valeurs des premiers zéros x} > 0 de la fonction de Bessel J, et des premiers 
zéros yx > 0 de la fonction de Bessel J1 = —Jf : on a Jo(xx) = 0 = Ji(yx). 


1 


2 


3 


4 


5] 


6 


7 


8 


9 


10 


Tk 


2,4048 


5,5200 | 8,6537 


11,7915 


14,9309 


18,0710 


21,2116 


24,3524 


27,4934|30,6346 


Uk 


3,8317 


7,0155110,1734 


13,3236 


16,4706 


19,6158 


22,7600 


25,9036 


29,0468|32,1896 
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3. Analyse de données 


Le tableau ci-dessous présente des données sociologiques recueillies dans dix-huit 
villes françaises et complétées par des résultats sur les élections municipales des 11 
et 18 mars 2001 (source : Le Monde). 


poptot | popetr | logsoc | chomage | txhab | revenu | votants maj 
Poitiers 83507 | 3216 | 24,00 9,70 | 21,96 | 43082 | 25274 | 53,00 
Reims 187181 | 10117 | 45,00 10,90 | 10,89 | 43924 49318 | 51,58 
Marseille 797491 | 54355 | 17,00 17,70 | 21,93 | 43801 | 214637 | 48,57 
Le Havre 190924 | 8208 | 33,40 14,40 | 17,67 | 41060 | 63462 | 57,87 
Besançon 117691 | 7947 | 26,80 8,00 | 18,83 | 43751 | 33191 | 55,30 
Strasbourg 263941 | 34138 | 23,60 6,10 | 14,26 | 48878 | 67987 | 50,85 
Nice 343123 | 30914) 8,00 10,90 | 18,96 | 48549 | 104373 | 44,48 
Lyon 445274 | 35583 | 15,00 12,60 | 11,62 | 56860 | 134347 | 48,56 
Amiens 135449 | 6180 | 34,16 14,00 | 17,97 | 39935 | 41854 | 52,06 
St Denis Réunion | 131649 | 1394 | 35,00 30,00 | 13,43! 35775 | 40348 | 51,11 
Nancy 103552 | 6133 | 18,00 10,10 | 11,56 | 49716 | 26566 | 50,81 
Toulouse 390301 | 28073 | 17,30 12,50 | 17,99 | 45941 | 122901 | 55,13 
Brest 149649 | 2997 | 18,49 9,90 | 15,42 | 41559 | 44439 | 57,55 
Boulogne Bill. 106316 | 12600 | 8,32 6,10 | 9,27, 94074] 29682 | 66,08 
Evry 49397 | 6472 | 47,00 9,70 | 17,62 | 41568 | 10142 | 44,17 
Versailles 85761 | 4732 | 15,70 5,71! 8,95 | 82208 | 28306 | 50,43 
Neuilly 59874 | 6584] 2,50 7,20 | 3,94 | 196642 | 17759 | 76,83 
St Denis 85994 | 22535 | 49,04 20,40 | 9,17) 36534] 14872 | 53,00 


Voici la signification des variables-caractères : 


poptop est la population totale, 

popetr est la population étrangère, 

logsoc est le parc de logement social, 

chomage est le taux de chomage (d’après l'INSEE), 

txhab est le montant de la taxe d’habitation, 

revenu est le revenu annuel moyen par habitant (sur la base des revenus en 1998), 
votants est le nombre de votants au premier tour, 

maj est le pourcentage obtenu par la liste majoritaire. 


poptot popetr | logsoc | chomage | txhab | revenu votants | maj 
moyenne | 207059, 66 | 15676,55 | 24,35 | 11,99 | 14,52 | 57436,5 | 59414,33 | 53,74 
écart-type | 181881,25 | 14549,49 | 13,31 5,81 4,85 | 36836,59 | 51521,14 | 7,44 
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Demi-matrice des covariances (à compléter par symétrie) : 


1 
0,89 1 

028-024 1 

0,21 0,09 0,41 1 

0,42 0,25 0,15 0,14 1 

0,22 —0,14 —0,58 —0,39 —0,66 1 

0,99 0,87 —0,32 0,20 0,43 —0,21 1 
0,82 0,31 =0,41 0,25 053: 0,79 0,31 1 


valeurs propres | 3,59 | 2,40 | 0,95 | 0,53 | 0,30 | 0,13 | 0,10 | 0,00 
poids 44,89 | 29,98 | 11,84 | 6,63 | 3,77 | 1,62 | 1,20 | 0.06 


Voici les coordonnées des projections des villes dans le premier plan factoriel et les 
qualités de représentation. 


coordonnée 1 | coordonnée 2 | qualité 
Poitiers 0,31 1,03 0,27 
Reims 0,30 1,16 0,42 
Marseille —5,02 —2,18 0,97 
Le Havre —0,09 0,79 0,34 
Besançon 0,43 0,65 0,27 
Strasbourg —0,73 —0,63 0,31 
Nice —1,93 —0,91 0,71 
Lyon —1,84 —1,53 0,81 
Amiens —0,01 1,34 0,84 
St Denis Réunion —0,16 2,15 0,38 
Nancy 0,91 0,34 0,46 
Toulouse —1,65 —1,03 0,91 
Brest 0,70 0,18 0,30 
Boulogne Bill. 2,20 —1,68 0,95 
Evry 0,24 2,32 0,74 
Versailles 1,62 —0,37 0,56 
Neuilly 4,44 —3,47 0,94 
St Denis 0,29 1,83 0,41 
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Index d'Algèbre 


affixe d’un point, 39 
aire d’un parallélogramme, 225 


analyse en composantes principales, 232-235 


angle polaire, 39 
antécédent, 20 
application, 12 
identité, 23 
linéaire, 167 
arbre, 79 
de recouvrement, 80 
arcs d’un graphe, 78 
argument d’un nombre complexe, 37 
arrangement, 60 


base, 106, 162 
canonique, 106 
orthonormée, 205 
bijection, bijection réciproque, 22 


Cayley-Hamilton (théorème de), 152 
changement 

de base, 166, 171 

de référentiel, 24 
chemin dans un graphe, 78 
cofacteur, 145 
combinaison 

avec répétitions, 64 

linéaire, 102, 162 
complémentaire, 3 
composée de deux fonctions, 14 
conditionnement d’une matrice, 245 
conjugué d’un nombre complexe, 36 
coordonnées 

d’un vecteur, 165 

polaires, 39 
cycle 

(permutation), 71 

dans un graphe, 78 


D'Alembert-Gauss (théorème de), 47 
degré d’un polynôme, 43 


dérivée d’un polynôme, 43 
déterminant, 144-146 
dimension, 116, 164 
distance, 221 

à un plan, 221 
division euclidienne, 4, 49 
droite, 116 

de régression, 211 


écart-type, 70 
élément d’un ensemble, 1 
élimination polynomiale, 154 
ellipse, 22, 219, 310 
ensemble fini, 57 
équation 
du second degré, 51 
linéaire, 104 


équations d’un sous-espace vectoriel, 112 


espace 
hermitien, euclidien, 200 
vectoriel, 101, 162 

espérance d’une variable aléatoire, 69 

exponentielle 
d'un nombre complexe, 38 


factorisation LU, 247 
flot (dans un graphe), 87 
fonction, 12 

constante, 12 

croissante, décroissante, 15 
formule 

de la dimension, 172 

de la médiane, 203 

de Taylor, 44 

du binôme de Newton, 61, 136 
formules de Moivre, 37 


Gauss (méthode de), 107-112 
glissement, 40 
Gram-Schmidt (algorithme de), 206 
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graphe, 78 


connexe, 78 
orienté, 86 
pondéré, 80 


groupe 


affine, 141 

de transformations, 28 
des permutations, 70 
engendré, 28 


Hôürner (méthode de), 48 
hyperbole, 22 


hyperplan, 116 


image 


d'une application, 13, 172 
d'une partie, 13 


inclusion, 1 


inégalité 


de Cauchy-Schwarz, 204 
triangulaire, 36, 204 


intersection, 3 


intervalle, 8 
inverse 


d’une matrice, 138 
d’une transformation, 28 


isométrie, 214 


itérés d’un élément, 15, 184 


ligne de niveau, 21 


loi 


des grands nombres, 69 


LU (factorisation), 246 


matrice, 129 


582 


-colonne, 101, 129 
-ligne, 129 
à diagonale 

strictement dominante, 127, 250 
d'inertie d’un solide, 227 
d’une application linéaire, 168 
de commandabilité, 191 
de passage, 166 
de transitions, 188 
des covariances, 232 
diagonale, 130 
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diagonalisable, 177 
hermitienne, 215 
inversible, 138 
nilpotente, 182 
orthogonale, 213 
symétrique, 131, 217 
définie positive, 218 
transposée, 131 
triangulaire, 139 
tridiagonale, 142 
unitaire, 213 
unité, 133 


meilleure approximation rationnelle, 9 


module d'un nombre complexe, 36 
moindres carrés (méthode des), 211 


nombre binomial, 61 
nombres 
complexes, 35 
entiers, rationnels, réels, 4-9 
norme 
d’un vecteur, 200 
d'une matrice, 242 
noyau, 172 


orthogonal d'un sous-espace, 208 


partie 
d'un ensemble, 1 
entière, 8 
réelle ou imaginaire, 36 
partition, 21 
permutation, 70 
plan, 116 
plans factoriels, 232-235 
point fixe, 15 
polynôme, 43 
caractéristique, 151, 171 
polynômes étangers, 50 
principe des tiroirs, 59 
probabilité binomiale, 67 
produit 
cartésien, 2 
de matrices, 131 
hermitien, scalaire, 200 
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mixte, 224 

vectoriel, 223 
projection, 168 

orthogonale, 209, 221 
Pythagore (théorème de), 203 


racine 

d'un polynôme, 44 
racines n-ièmes, 48 

de l'unité, 47 
rang 

d'un système linéaire, 111 

d'une matrice, 137 
relaxation (méthode de), 248 
résultant de deux polynômes, 155 
réunion, 3 
rotation 

dans l’espace, 228 

plane, 41, 168 


scalaire, 101 
segment, 8 
similitude, 41 
sommets d’un graphe, 78 
sous-espace 
affine, 117 


propre, 176 

vectoriel, 103, 162 
support d’un cycle, 71 
symétrie orthogonale, 222 
système 

en échelons, 110 

homogène, 105 

linéaire, 104 

linéaire contrôlé, 191 


trace, 152 

transformation, 15 
affine, 140 
diagonalisable, 177 
linéaire, 167, 184 

transposition, 71 

tri à bulles, 77 


valeur propre, 173 
variance d’une variable aléatoire, 70 
vecteurs, 101, 162 
canoniques, 102 
indépendants, 105, 162 
orthogonaux, 201 
propres, 173 
qui engendrent, 103, 162 
volume d’un parallélépipède, 225 


INDEX D'ALGÈBRE - 583 


© Dunod -— La photocopie non autorisée est un délit. 


Index d'Analyse 


abscisse curviligne, 313 

aire (calcul d’une), 399, 434 
approximation affine en un point, 272, 364 
approximations en moyenne, 413, 552 


Bessel 
(égalité de), 550, 551, 554 
(fonctions, équation de), 394, 473, 474, 542 


centre de gravité d’un solide, 402 
champ 

de gradient, 417 

de vecteurs, 415, 500 
changement de 

variable dans une intégrale, 320, 403 
circulation d’un champ de vecteur, 423 
coefficient d’élasticité, 280 
compact, 362 
compression d'images, 568 
condition initiale, 442 
coordonnées 

cylindriques, 405 

polaires, 368 

sphériques, 368 
courbe 

définie implicitement, 378, 520 

paramétrée, 310 

régulière, 311 
courbure, 314 
covariance, 381 


décomposition 
de Fourier, 555 
en ondelettes, 564 
densité d’une variable aléatoire, 329, 407 
dérivée, 271 
d’une fonction à valeurs complexes, 321 
d’une série entière, 537 
logarithmique, 279 
partielle, 362 
sous le signe intégrale, 386 


développement 
de Puiseux, 396 
en série entière, 538, 541 
limité, 301, 303 
différentielle, 278, 364 
disque de convergence, 536 
distance, 361 
divergence d’un champ de vecteurs, 421 


écart-type, 70, 329 
échelle de comparaison, 269 
élément d’aire, 400 
ellipse, 310 
équation d’Euler, 468 
équation différentielle 
à variables séparées, 446 
autonome, 443 
de Bessel, 394, 474, 542 
de Legendre, 543 
de Newton, 460 
du premier ordre, 442 
linéaire 
à coefficients constants, 452-455 
d'ordre deux, 450 
du premier ordre, 443-445 
équilibre, 460, 489, 501 
asymptotiquement stable, 503, 508 
stable, 464, 490, 503, 508 
équivalents, 265 
espérance 
d'une variable aléatoire, 69, 329, 407 
Euler (équation d’), 468 
extremum : voir maximum, minimum, 373 


flux d’un champ de vecteur, 428 
fonction 
Arc sinus, 277 
Arc tangente, 277 
continue, 281, 283, 361 
continüment dérivable par morceaux, 558 
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contractante 
au voisinage d’un point fixe, 263 
croissante, décroissante, 264, 283, 297 
de Bessel, 394, 474, 542, 577 
de carré intégrable, 553 
de Gauss, 333, 577 
de répartition 
d’une variable aléatoire, 328, 406 
dérivable, 271 
exponentielle, 268 
harmonique, 372, 433 
(coordonnées cylindriques), 394 
(coordonnées sphériques), 546 
intégrable, 285 
logarithme, 267 
majorée, minorée, 264 
négligeable, 265 
puissance, 267, 269 
racine n-ième, 267 
racine carrée, 275 
sinus ou cosinus hyperbolique, 268 
spline cubique, 350 
forme différentielle, 425-427 
formule 
de la moyenne, 290 
de Poisson, 574 
de Stirling, 270 
de Stokes, 430 
de Taylor-Young, 301 
formules 
trigonométriques de linéarisation, 318 
Fourier 
(coefficients de), 549 
(décomposition de), 555 


gradient, 364, 417 
(méthode du), 376 


inégalité 

de Cauchy-Schwarz, 207 

des accroissements finis, 298 
infiniment petit, infiniment grand, 265, 301 
intégrale, 284-286 

à paramètre, 386 

curviligne, 423 
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d’une fonction rationnelle, 321 
d’une forme différentielle, 427 
de Wallis, 341 
double ou triple, 398 
généralisée, 324, 327, 405 
intégration 
d’une série entière, 537 
numérique, 354, 519 
par changement de variable, 320 
par parties, 319 
interpolation 
fonctions spline, 350-353 
polynômes de Lagrange, 343 
isoclines, 440 


krigeage, 381-386 


laplacien, 252, 372, 394, 546, 573 
Legendre (polynômes, équation), 543 
Liapounov (fonction de), 507 
lignes 
de champ, 416 
de niveau, 359 
limite d’une fonction, 264 
linéarisation 
d'un système différentiel, 503 
d’une transformation, 388 
loi de conservation de l'énergie, 425, 510 
loi de probabilité 
binomiale, 67, 331-333 
exponentielle, 331 
normale, 334, 409 
uniforme, 330 
longueur d’un arc, 313 


matrice 
de commandabilité, 495 
hessienne, 375 
jacobienne, 364, 367 
résolvante, 487 
maximum, minimum 
local, 273, 373 
sous contraintes, 378 
méthode 
de la moyenne pente, 519 
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de variation de la constante, 444, 492 


moment d'inertie, 227, 402 
moyenne d’une fonction, 289 


Newton 
(équation de), 460 
(méthode de), 307 
normale principale, 315 
norme, 204, 207, 361, 548 
notation petit o, 301 


oscillateur, 454-457 


partie principale, 270 
plan 
des phases, 462, 509 
tangent, 365, 371, 400 
planimètre, 435 
point 
critique, 373 
fixe attractif, 262 
intérieur, 361 
polynôme 
d'interpolation, 344 
trigonométrique, 549 
polynômes 
de Chebychev, 348, 358 
de Lagrange, 344 
de Legendre, 544 
potentiel, 417 
primitives, 290 
(calculs de), 317 
usuelles, 298 
principe de superposition, 452 
produit 
de convolution, 409, 413, 559 
de séries entières, 535 


rayon de 


convergence d’une série entière, 534 


résonance, 456 
rétro-contrôle, 496 
rotationnel, 418 


série, 527 
absolument convergente, 531 
alternée, 530 
d’Abel, 530 
de Fourier, 556 
de Riemann, 529 
entière, 533 
géométrique, 528 
Simpson (méthode de), 355 
stabilisation par bouclage, 496 
stabilité : voir équilibre, 503 
Stokes (formule de), 430 
suite, 261-263 
surface, 359 
paramétrée, 400 
système différentiel, 477 
autonome, 478, 500 
hamiltonien, 509 
linéaire, 480 
contrôlé, 495 
linéarisable, 504 


tangente 
à une courbe, 271, 311, 370 
théorème 
de la limite centrée, 335 
des accroissements finis, 297 
des fonctions implicites, 377 
des valeurs intermédiaires, 282 
trajectoire, 462, 486, 500 
travail d’une force, 423 


variables aléatoires indépendantes, 335, 406 
variance d’une variable aléatoire, 70, 329, 407 


variations (calcul des), 466 
vecteur 
dérivé, 311 
normal, 315 
normal à une surface, 400 
tangent, 311 
volume (calcul d’un), 401 


wronskien, 473 


zone piège, 513 
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